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(Makron) Vokallänge im Althochdeutschen 
(Zirkumflex) Vokallänge im Mittelhochdeutschen 
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Teill Einleitung 


1. Thema und Ziele der Arbeit 


Das Thema der vorliegenden Arbeit ist der i-Umlaut im 
Althochdeutschen. Als Umlaut wird in der historischen Linguistik 
traditionell die Assimilation betonter Stammsilbenvokale an 
nachfolgende schwach- oder unbetonte Vokale bezeichnet. Der i-Umlaut 
in den germanischen Sprachen, insbesondere im Althochdeutschen, gilt 
wiederum als prototypisches Beispiel für Umlaut. Die am wenigsten 
umstrittenen Fälle des althochdeutschen i-Umlauts bestehen in dem 
Wandel von kurzem a zu kurzem e vor nachfolgendem i oder j. Dieser 
Wandel ist bereits in einigen Texten aus der Mitte des 8. Jahrhunderts 
nachweisbar. Sichtbar wird er regelmäßig vor i-haltigen Flexions- oder 
Wortbildungssuffixen: Zu der Form des Nominativs Singular ahd. gast 
‘Gast’ gehört der Nominativ Plural gesti ‘Gäste’, zur 1. Person Präsens faru 
‘ich fahre’ gehören die Formen der 2. und 3. Person feris ‘du fährst’, ferit 
‘er fährt’, das Adjektiv zu kraft ‘Kraft’ lautet kreftig ‘kräftig’. Während in 
den ältesten Texten noch unumgelautetes a anzutreffen ist, etwa ahd. 
angil ‘Engel’, alilenda ‘fremd, elend’ oder radia ‘Rede, Wort’, setzt sich der 
systematische Wandel von a zu e vor nachfolgendem i im Laufe des 9. 
Jahrhunderts auf dem gesamten althochdeutschen Sprachgebiet durch 
und kann in den Dokumenten zuverlässig nachgewiesen werden. 

Nur kurz soll in der Einleitung auf die problematischeren Fälle 
hingewiesen werden. Sie werden weiter unten ausführlicher zu 
besprechen sein. Jegliche Anzeichen für Umlaut in den althochdeutschen 
Texten fehlen, wenn zwischen dem a und dem i die 
Konsonantenverbindungen ht oder hs oder ein beliebiger Konsonant 
gefolgt von einem w stehen. Man schrieb also ahd. mahti ‘Mächte (Nom. 
Pl.)’, wahsit ‘wächst (3.Sg. Präs.) und garwita ‘bereitete vor, rüstete zu 
(1.Sg. Prät. trotz des unbetonten i in der zweiten Silbe. Im 
oberdeutschen Sprachraum unterblieb der Wechsel von a zu e außerdem 
häufig vor hh, ch, h (< germ. *k) sowie vor l und r, wenn diesen ein 
weiterer Konsonant folgte. In oberdeutschen Denkmälern finden sich also 
regelmäßig Schreibformen wie slahit ‘schlägt (3.Sg. Präs.)’, haltit ‘halt 
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(3.Sg. Präs.)’ und chalbir ‘Kälber (Nom. P1., denen im Fränkischen die 
umgelauteten Formen slehit, heltit, kelbir entsprechen. Zudem wurde 
generell kein Umlaut geschrieben, wenn das umlautauslösende i in der 
dritten Silbe stand, zum Beispiel bei ahd. aruzzi ‘Erz (Nom. Sg.)’, zahari 
‘Träne (Nom. Pl.)’, magadi ‘Magd (Nom. PI.)’. Jedoch tauchen ab dem 12. 
Jahrhundert, mehr als 400 Jahre nach den ersten orthographischen 
Markierungen für den Umlaut von a zu e, in allen oben genannten 
Sonderfällen ebenfalls orthographische Umlautmarkierungen auf und 
man schreibt mhd. mähte (< ahd. mahti), wähst (< ahd. wahsit), gärbte 
(< ahd. garwita), ärze (< ahd. aruzzi), zähere (< ahd. zahari), mägede (< 
ahd. magadi) etc. Auch die Umlaute der übrigen velaren Vokale werden 
erst im Mittelhochdeutschen in der Schrift markiert. Es entsprechen sich 
ahd. swari ‘schwer’ — mhd. swerre, ahd. roti ‘R6te’ — mhd. reete, ahd. suri 
‘Säure’ — mhd. siure, ahd. oli ‘Öl’ — mhd. öl, ahd. wurfil ‘Würfel’ — mhd. 
würfel, ahd. loubir ‘Blatt, Laub (Pl.)’ — mhd. löuber, ahd. guoti ‘Güte — 
mhd. güete. Handschriftlich unterliegen die Umlautschreibungen jedoch 
im Alt- wie im Mittelhochdeutschen starker Variation. So erscheinen die 
Umlaute der Kurzvokale ahd. a und u handschriftlich unter anderem als 
(e, ae, æ, 4, e, ei, ai) bzw. (ui, i, iu, y, ù, Ñ, ù, ü), die Umlaute der 
Langvokale ä, 6 und ü unter anderem als (æ, a, e), (oi, oe, 6) bzw. (iu, ui), 
die Umlaute der Diphthonge ahd. ou und uo unter anderem als (eu, ev, 
ew, au, æu, 6, Ôu, Oi) bzw. (ui, ü, ú). 

Die Bestimmung der internen Chronologie der Umlautprozesse bildete 
von Anfang an ein Forschungsproblem. So wurde unterschieden zwischen 
Primärumlaut a > e und Sekundärumlaut a > ä (erstmals so benannt 
von Heusler 1889:125). Diese Unterscheidung war chronologisch gemeint 
in dem Sinne, dass der primäre Umlaut älter sei als die übrigen, 
sekundären Umlaute,' denn was zuerst in der Schrift auftauche, müsse 
auch der ältere Lautwandel sein. Andererseits deutet alles darauf hin, 
dass der Umlaut systematisch dort steht, wo einmal i oder j in vor- oder 
frühalthochdeutscher Zeit auf einen velaren Vokal folgten. Da aber genau 
jene i und j, die den Umlaut auslösen, seit dem 9. Jahrhundert 
schwinden, können sie scheinbar nur für den seit dem 8. Jahrhundert 


1 Ganz ähnlich unterschied auch Axel Kock (1889) zwischen verschiedenen 
Umlautperioden im Altnordischen (älterer i-Umlaut, umlautlose Periode, jüngerer 
i-Umlaut). 
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markierten Umlaut a > e verantwortlich sein. Bereits als die ersten 
Markierungen der iibrigen Umlaute im 10. und 11. Jahrhundert 
sporadisch auftauchen (iu als Umlaut von ü bei Notker, ui als Umlaut von 
uo bei Otloh und in späten Glossen), sind die eigentlichen 
Umlautauslöser zum großen Teil geschwunden. Twaddell (1938) lieferte 
im Rahmen der strukturalistischen Phonologie erstmals eine theoretisch 
fundierte Begründung für eine chronologisch einheitliche Auffassung des 
Umlautprozesses im Deutschen. Demnach kannte das Althochdeutsche 
allophonische Umlautalternanzen, die erst später mit der Reduktion der 
Nebensilbenvokale zum Mittelhochdeutschen hin phonemisiert und dann 
auch orthographisch markiert wurden. Dieser Ansatz setzte sich zwar 
rasch als Standarderklärung für den i-Umlaut durch, wurde jedoch auch 
stets als unempirisch kritisiert, weil er vom zeitversetzten Einsetzen der 
Umlautgraphien abstrahierte. In der vorliegenden Arbeit wird Twaddells 
Erklärungsansatz grosso modo als vernünftigste Erklärung der Gesamtlage 
aller deutschen Umlautdaten übernommen, im Detail ergänzt und 
korrigiert und gegen neuere Einwände und konkurrierende Ansätze 
verteidigt. 

Ein weiteres Rätsel, das der Umlaut aufgibt, ist die Phonemisierung 
der Umlautallophone vor i und j. Wenn die Umlautfaktoren i und j 
reduziert werden, müssten auch die Umlautallophone wieder 
verschwinden. Und tatsächlich taten sie dies auch in vielen Fällen. Was 
sind die Voraussetzungen dafür, dass aus Allophonen stabile Phoneme 
werden? In dieser Arbeit wird eine phonetische Erklärung auf Basis der 
Koartikulationskompensation in Kombination mit einer lexikalischen 
Lösung auf Basis der Gebrauchsfrequenz einer Wortform vorgeschlagen. 
Subphonemische Assimilationen sind traditionell ein 
Untersuchungsgegenstand der Phonetik und werden dort unter 
artikulatorischen und auditiven Gesichtspunkten untersucht. In jüngerer 
Zeit rücken subphonemische Prozesse jedoch wieder verstärkt in den 
Fokus phonologischer Analysen. Die artikulatorischen und auditiven 
Aspekte der Koartikulation müssen auch bei einer phonologischen 
Umlautanalyse berücksichtigt werden, wenn nicht nur eine formale 
Zusammenfassung, sondern eine grundlegendere Erklärung des 
Phänomens angestrebt wird. Ein Ziel der vorliegenden Arbeit ist es daher, 


? vgl. Braune & Reiffenstein (2004: 840, Anm. 3 sowie 842) 
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die Ergebnisse der Koartikulationsforschung aus der Phonetik in einen 
Erklärungszusammenhang mit der phonologischen Beschreibung des 
Umlauts im Althochdeutschen zu bringen. Insbesondere soll die 
Phonemisierung der Umlautallophone phonetisch erklärt werden. Dass 
sich daraus Perspektiven für die Erklärung weiterer, wenn nicht gar aller 
Fälle von Phonemisierung ergeben, ist durchaus beabsichtigt. Durch die 
Berücksichtigung der Gebrauchsfrequenz können zudem morphologische 
Besonderheiten der ältesten Umlautbelege, zum Beispiel beim Optativ 
Präteritum der rückumlautenden Verben, leicht erklärt werden. 

Ein typologisches Problem, das in den theoretischen Arbeiten zum 
Umlaut bisher keine Beachtung fand, sind die außergewöhnlichen 
Bedingungen des Umlauts. Vokalharmonische Assimilationen gehen 
üblicherweise von prominenten Positionen aus (betonten Silben, 
morphologischen Stämme) und zielen auf Laute in weniger prominenten 
Positionen (unbetonte Silben, Affixe). Beim Umlaut ist dies anders. 
Systematisch bewirkt ein i oder j in unbetonter (Affix-)Silbe die 
Umlautung der vorangehenden betonten, velaren Stammvokale. Anhand 
des althochdeutschen i-Umlauts wird gezeigt, dass die Assimilation eines 
Vokals in prominenter Position an einen Vokal in weniger prominenter 
Position stärkeren Restriktionen unterliegt als im umgekehrten Fall einer 
stammkontrollierten Vokalharmonie. Dass der Umlaut als Prozess in den 
Sprachen der Welt eher selten ist, wurde innerhalb der germanistischen 
Sprachgeschichtsforschung nicht weiter beachtet.” Eine Herausforderung 
besteht nun darin, eine Typologie zu entwerfen, die nicht nur auf den 
Umlaut in einem bestimmten Sprachzweig, etwa dem Althochdeutschen 
oder dem Altnordischen, passt, sondern die in einer Umlauttypologie 
mündet, in die sich die Umlautdaten verschiedenster Sprachen einordnen 
lassen. Die vorliegende Arbeit unternimmt einen ersten Schritt in diese 
Richtung und geht dabei vom i-Umlaut im Althochdeutschen als 
prototypischem Fall eines Umlauts aus. 


3 Innerhalb der germanischen Sprachen kommen Umlautungen ja durchaus 
häufig vor. Und auch ein Blick zur Romanistik lehrt, dass in den romanischen 
Sprachen umlautähnliche (aber vom Umlaut doch zu unterscheidende) 
Lautwandelprozesse unter dem Namen „Metaphonie“* untersucht werden. 
Womöglich erscheint den meisten Sprachhistorikern deshalb der Umlaut nicht 
ungewöhnlich. 
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Die Ergebnisse dieser graphemischen, phonologischen und 
typologischen Überlegungen sollen schließlich in eine 
optimalitätstheoretische Analyse des Umlauts einfließen. Bei der 
synchronen Darstellung des althochdeutschen i-Umlauts wird bei aller 
formalen Komplexität eine größtmögliche Einfachheit angestrebt. Die 
Einfachheit soll sich vor allem in einer geringen Anzahl 
umlautspezifischer OT-Beschränkungen zeigen. Eine besondere Heraus- 
forderung werden dabei die zahlreichen Ausnahmen beim sogenannten 
Primärumlaut darstellen. Ziel ist es, die nachweisbaren Ausnahmen von 
der Primärumlautregel auf die Aktivität einer einzigen OT-Beschränkung 
und auf die Einschränkung der prosodischen Wirkungsdomäne des 
Umlauts zurückzuführen. Da prosodische Kategorien bei der 
Beschreibung des Umlauts im Althochdeutschen eine wesentliche Rolle 
spielen, wird im Zusammenhang mit der optimalitätstheoretischen 
Darstellung des Umlauts auch eine Analyse der Prosodie des 
Althochdeutschen im Rahmen der Optimalitätstheorie notwendig sein. 
Sie ist ein Nebenprodukt der vorgelegten Beweisführung. 


2. Methodologische Vorbemerkungen 


Wie bereits angedeutet, sind auch zwei Jahrhunderte nachdem Jacob 
Grimm als erster die lauthistorischen Zusammenhänge des Umlauts in 
den germanischen Sprachen beschrieb, die wesentlichen 
Grundprinzipien, nach denen die Umlautung ablief, noch immer nicht 
eindeutig geklärt und Sprachwissenschaftler diskutieren über 
fundamental verschiedene Erklärungsansätze. Während das schreibungs- 
positivistische Lager nur den sogenannten Primärumlaut von a zu e in der 
althochdeutschen Sprachperiode ansetzt, führen 
Schreibungskonstruktivisten zwingende Gründe dafür ins Feld, dass die 
Umlautphonemisierung aller Umlautvokale bereits in althochdeutscher 
Zeit abgeschlossen worden sein muss. Das Unterfangen, den Umlaut 
eindeutig zu fassen, scheitert nicht unbedingt an der unsicheren 
Datenlage. Im Gegenteil sind es eher die schiere Menge an 
Originalbelegen in den Denkmälern und die Vielzahl an Reflexen in den 
modernen Sprachen und Dialekten der germanischen Sprachfamilie, die 
eine einheitliche Interpretation der Daten erschweren. Manchmal drängt 
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sich der Eindruck auf, man wiisste zu viel, um alle Daten unter einen Hut 
zu bringen. Wäre die Datenlage so spärlich wie zu vielen anderen 
historischen Sprachformen, die Sprachwissenschaftler hatten schon langst 
eine elegante Lösung des Problems gefunden. 

Damit ist ein grundlegendes methodologisches Problem der 
historischen Sprachwissenschaft berührt, und zwar der Zwiespalt, 
wonach einerseits die Schreiber des Althochdeutschen und die in den 
Denkmälern vorliegenden Daten respektiert werden müssen, andererseits 
aber auch plausible Analysen und Interpretationen der Datenlage 
gefunden werden sollen. Da die althochdeutschen Texte das 
phonologische System ihrer Schreiber nicht unmittelbar wiedergeben, 
können diese Daten nur als Ausgangspunkt für eine typologisch 
glaubhafte Rekonstruktion des Phoneminventars und der 
Lautwandelprozesse dienen. Der Frage, ob allophonische Variation in der 
Schrift notwendigerweise angedeutet werden muss, wie einige 
Schreibungspositivisten behaupten, kommt dabei eine entscheidende 
Stellung zu (hierzu ausführlich Penzl 1982; Glaser 1988). Dass diese 
graphematischen Interpretationsprobleme nicht nur bei der 
Untersuchung des althochdeutschen i-Umlauts, und hier insbesondere des 
heftig debattierten Primärumlauts a > e, auftreten, zeigt ein Blick auf 
Erklärungsunsicherheiten in einem anderen, gut erforschten Sprachzweig 
des Westgermanischen: Bedeuten die altenglischen Schreibungen 
(doehter) ‘Töchter’ oder (buiris) ‘Meißel’, dass ein Diphthong in der 
Wurzel stand, oder sind (oe, ui) als Grapheme für die kurzen, gerundeten 
Vorderzungenvokale [ø] und [y] aufzufassen (so z.B. Antonsen 1961)? 

Ein weiteres methodisches Problem kann die Frage sein, ob eine 
bestimmte Wortform als Beleg für den i-Umlaut eingeordnet werden darf: 
dort nämlich, wo weder i noch j in der Folgesilbe durch Belege gesichert 
sind, sondern in rekonstruierten Formen einer Vorstufe angesetzt werden 
müssen. So gilt zahlreichen Forschern die Form gestumR ‘Gästen (Dat. 
Pl.) (< germ. *gastim(@)z) auf dem voraltisländischen Stentoften-Stein 
(600-650 n. Chr.) als ältester Belege für i-Umlaut in einer germanischen 
Sprache. Sollte es sich tatsächlich um einen i-Umlaut handeln, so würde 
hier allerdings jegliche Spur eines umlautauslösenden *i fehlen (Antonsen 
1975:85, 27; Schulte 1998:76-82). Eine mögliche Erklärung wäre, dass 
das alte *i der Endung in Analogie zu den a- und u-Stämmen beseitigt 
wurde: germ. *-imR > nordgerm. -umR (so etwa Basbgll 1982). Oder es 
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stand nie ein i in der Flexionsendung und der Umlaut in gestumR ist 
morpho-lexikalisch bedingt (so Janda 1998:169f.). Der 
Palatalisierungseffekt des Umlauts wäre demnach auf *gastumR 
übertragen worden, wodurch die belegte Form gestumR entstand. Das 
gleiche Grundproblem taucht auch bei umgelauteten Wortformen im 
Althochdeutschen auf, wenn keine Belege mit i oder j in der Folgesilbe 
vorliegen, z.B. ahd. becko ‘Backer’ aus nicht belegtem *bakk-jo als 
Agentivableitung zum starken Verb ahd. backan ‘backen’ oder ahd. henna 
‘Henne’ als femininer jon-Stamm und Movierung des Maskulinums ahd. 
hano. 

In eine ganz andere Richtung geht das dritte zu erwähnende Problem: 
Ein Schwanken in der Orthographie darf nicht einfach gleichgesetzt 
werden mit lautlicher Vielfalt. Bereits Paul (1879:4-6) zählt mögliche 
Fehlerquellen bei der Beurteilung von Doppelschreibung innerhalb eines 
Dialektes auf. Um nicht vorschnell auf ein Lautgesetz zu schließen, müsse 
man mit Kontaminationen mehrerer Mundarten durch Entlehnungen aus 
anderen Dialekten oder durch Mischung des Dialektes der Vorlage mit 
dem des Schreibers rechnen. Bei der Beurteilung der Doppelschreibungen 
seien die geographische und die chronologische Verteilung der Varianten 
ebenso zu berücksichtigen wie Nebeneinanderschreibung von alter und 
neuer Form in einer Zeit des Lautübergangs. Paul (1879) nennt auch den 
Einfluss der Schreibtradition, den man bei der Entwicklung der 
Lautgesetze berücksichtigen müsse.“ Die Vorstellung von einem 
einheitlichen althochdeutschen Vokalsystem, wie es — dem Zwang zur 
Vereinfachung folgend - meist angesetzt wird, ist zumindest 
irreführend. Plausibler ist es anzunehmen, dass verschiedene 
Schreibsysteme parallel nebeneinander vorkommen. Insofern scheint es 


* Was jedoch den Umlaut angeht, interpretiert Paul althochdeutsche Umlaut- 
schreibungen als Zeichen für Umlaut, fehlende Umlautschreibung als Zeichen für 
fehlenden Umlaut. Infolgedessen fasst er den Sekundärumlaut auf als eine 
„stoffliche verschiedenheit“, die durch eine „formale ausgleichung“ (Paul 
1879:8f.), also durch analogen Ausgleich, geschaffen wurde und bezieht sich dabei 
explizit auf Fälle, die heute als lautgesetzlich eingetretener Sekundärumlaut gelten 
müssen (nhd. Nägel < mhd. nagele oder nhd. älter < mhd. alter). Obwohl er also 
gerade die Lautgesetze stark machen möchte, sieht er hier ausdrücklich von einer 
lautgesetzlichen Erklärung ab. 
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der einzig richtige Ansatz zu sein, sich auf die phonemische Analyse von 
Einzeltexten zu beschränken, wobei auch innerhalb eines Textes mit 
Schreibschwankungen zu rechnen ist.” 

Wie man nach einem traditionellen, philologisch orientierten Ansatz 
mit diesen Schwierigkeiten umzugehen hat, lässt sich im Handbuch zur 
Geschichte der deutschen Sprache und ihrer Erforschung in den zwei Artikeln 
zur Phonologie und Graphemik des Alt- und Mittelhochdeutschen von F. 
Simmler (2000a; 2000b) nachlesen. Demnach besteht das Ziel der 
historischen Sprachforschung bezogen auf das Althochdeutsche in der 
„Ermittlung von Phoneminventaren, -distributionen, -systemen, um 
neben Aufbauprinzipien der Systeme aus koexistierenden und zeitlich 
aufeinanderfolgenden Systemen die Möglichkeit einer Kommunikation 
ohne überregionale Ausgleichssprache erfassen und Einsichten in 
Sprachwandelphänomene gewinnen zu können“ (Simmler 2000a:1155). 
Die hierfür zu erarbeitenden Methoden müssten exemplarisch erprobt 
und die Überlieferung vollständig  „graphemisch-phonologisch- 
phonemisch“ ausgewertet werden — „Denkmal für Denkmal und 
Schreibdialektgebiet für Schreibdialektgebiet“. Damit wendet sich 
Simmler explizit gegen die Errichtung von rekonstruierten 
phonologischen „Over-all-Systemen“, die von Dialektunterschieden 
abstrahieren (gegen Szulc 1987:78). Nicht geheuer sind ihm auch 
universelle Plausibilitätsüberlegungen, aufgrund derer allophonische 
Zwischenstadien angesetzt werden. Die vorhandene Variabilität der 
Graphe müsse vielmehr systematisch ausgewertet werden und bei der 
Aufstellung von Phonemsystemen und der Formulierung von 
Gesetzmäßigkeiten berücksichtigt werden. 

Simmler (2000a) listet folgende Methoden zur Untersuchung der 
althochdeutschen Schreibdialekte auf: (1.) Minimalpaarbildung, (2.) 
Distributionsanalyse und Frequenzangabe, (3.) chronologischer und 


5 So finden sich z.B. in der Kasseler Handschrift A der Exhortatio ad plebem 
christianam nebeneinander die Formen radia und redia. Diese Variation innerhalb 
einer Handschrift ist ein recht deutliches Zeichen dafür, dass a und e im 
Vokalsystem des Schreibers nicht bedeutungsunterscheidende Phoneme, sondern 
lediglich Allophone des Kurzvokals a waren. Das Umlaut-e konnte daher 
wahlweise mit (a) oder (e) wiedergegeben werden. Von dem Schwanken in der 
Orthographie darf hier nicht auf ein Schwanken der Lautung geschlossen werden. 
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geographischer Sprachvergleich, (4.) philologische Textanalyse. Dies 
seien „primäre, immer gemeinsam anzuwendende Methoden“ (Simmler 
2000a:1156), von denen die sekundären Methoden zu unterscheiden 
seien: (1.) Symmetrie und Ökonomie der Systeme, (2.) 
kommunikationstheoretische Aspekte, (3.) soziolinguistische 
Fragestellungen, (4.) kontrastiver Sprachvergleich — dieser allerdings 
nur „zu gegenwärtig gesprochenen Formen der Standardsprache und 
vergleichbarer Dialekte“ (Simmler 2000a:1156), nicht etwa mit allen 
Sprachen der Welt. Dementsprechend sieht die klassische philologische 
Vorgehensweise bei der Rekonstruktion des althochdeutschen 
Phonemsystems wie folgt aus: Ausgehend von Sätzen und Wörtern 
werden distinktive Segmente der Ausdrucksseite bestimmt, verschiedene 
Schreiberhände ermittelt. Es folgt die Konstruktion von Graphemen und 
Allographen, und zwar durchaus unter Bezug auf die Phonemebene, und 
schließlich eine Bestimmung des Phoneminventars. Dieser 
Vorgehensweise folgend wurden bereits einige Untersuchungen 
durchgeführt, zB. von Valentin (1962), der Vokal- und 
Konsonantensysteme bei Isidor, Tatian, Otfrid und Notker jeweils separat 
analysiert, von Penzl (1971a), der die Lautsysteme der Exhortatio, des 
althochdeutschen Isidor, bei Otfrid und Notker sowie in Otlohs Gebet 
untersucht, von Simmler (1981), der einzeltextweise die phonematischen 
Konsequenzen aus der zweiten Lautverschiebung für das Althochdeutsche 
nachweist, oder von Lühr (1982:75, 90), die anhand verschiedener 
Fassungen des Hildebrandlieds die Unterschiede altsächsischer, bairischer 
und ostfränkischer Vokalsysteme herausarbeitet. 

Die vorliegende Arbeit baut auf den bisher gewonnenen Ergebnissen 
auf. Als wichtigste Ausgangsbasis dienen dabei die Grammatiken zum 
Alt- und Mittelhochdeutschen von Braune & Reiffenstein (2004) und Paul 
(2007). Der Fokus liegt jedoch auf der grundlegenden Charakteristik des 
Umlauts und den damit zusammenhängenden theoretischen Fragen. 
Textkritische Probleme werden nur gelegentlich am Rande gestreift. Die 
verwendeten Belege wurden, sofern keine näheren Quellen angegeben 
sind, den genannten Ausgaben der Alt- und Mittelhochdeutschen 
Grammatiken entnommen oder wurden, sofern sie das Althochdeutsche 
betreffen, mit Hilfe des rückläufigen morphologischen Wörterbuchs von 
Bergmann (1991) bzw. des Althochdeutschen Wörterbuchs von 
Schützeichel (2006) gezielt gesucht. Die Arbeit soll eine gute Theorie 
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entwickeln, in deren Licht die empirische Beleglage einheitlicher, 
plausibler und damit besser interpretiert werden kann. Das gewählte 
Vorgehen folgt der Überzeugung, dass die Ergebnisse des 
Sprachvergleichs und der Sprachtypologie fruchtbar und hilfreich in die 
Sprachgeschichtsforschung einzubringen sind. Damit wird zugleich die 
Aufgabe wieder aufgenommen, eine systematische Übersicht über die 
Umlautphänomene und umlautähnlichen Erscheinungen außer dem i- 
Umlaut im Althochdeutschen zu erstellen — dies alles nicht gegen, 
sondern in Ergänzung zu den traditionelleren philologischen 
Herangehensweisen. 


3. Anfänge der Umlautforschung 


Die Forschungsliteratur zum althochdeutschen i-Umlaut hat einen 
Umfang erreicht, der es unmöglich macht, einen Überblick über alle 
Untersuchungen und vorgeschlagenen Lösungsansätze zu geben. In so gut 
wie jeder phonologischen Theorie wurde bisher eine eigene Analyse der 
Umlautdaten vorgelegt. Dazu kommen morphologische und phonetische 
Erklärungsansätze sowie die Forschungsliteratur zum Wirken des 
Umlauts in anderen germanischen Sprachen. Teilweise wurden Theorien 
eigens zur Lösung der Umlautfrage entworfen, man denke nur an die 
Mouillierungstheorie. Die wichtigsten Forschungsarbeiten zum i-Umlaut 
gehören mittlerweile bereits zum Lehrbuchwissen und sind zusammen 
mit neueren Ansätzen in den Forschungsgrammatiken zum Alt- und 
Mittelhochdeutschen genannt (Braune & Reiffenstein 2004: 8825-27 und 
851; Paul 2007: §L16 und §§L27-30). Auf einen umfassenden 
Forschungsüberblick wird daher an dieser Stelle bewusst verzichtet. 
Stattdessen soll die besondere Problematik des Umlauträtsels und seiner 
Erforschung dargestellt werden, die sich bereits in den frühesten Arbeiten 
zeigt. 

Schon im 12. Jahrhundert erwähnt der unbekannte, altisländische 
Autor des Ersten grammatischen Traktats, der sogenannte Erste 
Grammatiker, den Umlaut im Altisländischen.® Zusätzlich zu den Vokalen 


6 Der Text ist nur in einer Abschrift aus dem 14. Jahrhundert im Codex 
Wormianus überliefert. 
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a, e, i, o, u des lateinischen Alphabets müssten vier weitere eingeführt 
werden, nämlich 9, e, ø, y. Diese Buchstaben erklärt der Schreiber des 
Traktats jeweils explizit als Mischung aus den bereits bekannten, 
lateinischen Buchstaben, wobei das Konzept eines Buchstabens bei ihm 
neben der graphischen Seite auch die lautliche Seite umfasst. So habe das 
g seinen Schrägstrich vom e und den Kreis vom o (=graphische Seite), 
weil der so bezeichnete Laut eine Mischung aus den beiden Lauten e und 
o sei, wobei der Mund beim Sprechen weniger geöffnet sei als beim e 
aber mehr als beim o (=lautliche Seite). Das y bezeichne einen Laut, der 
aus den Lauten i und u bestehe, wobei der Mund beim Sprechen weniger 
geöffnet sei als beim i aber mehr als beim u. Die Lippenrundung bei der 
Aussprache des ø und y erwähnt er nicht. 

Erstaunlich modern ist die Minimalpaarbildung des Ersten 
Grammatikers zur Begründung der neuen Zeichen. Das Problem, welches 
er beheben wollte, bestand darin, dass die klassischen lateinischen 
Buchstaben allein nicht zur bequemen Wiedergabe seiner isländischen 
Muttersprache ausreichten. Das bedeutungsunterscheidende Potential der 
einzelnen Vokale macht es für ihn notwendig, neue Buchstaben, unter 
anderem Umlautzeichen, einzuführen. Seine Erwiderung auf den 
möglichen Einwand, man könne auch ohne neue Buchstaben, allein mit 
Hilfe der lateinischen Vokalzeichen die Wörter gut erraten, lautet in der 
Übersetzung von Haugen (1950):7 


„Now I shall take eight of these letters (since no distinction has yet been 
made for the i) and place each of them in turn between the same two 
consonants, and I shall show by examples how each of them when 
supported by the same letters and placed in the same position, makes a 
different sound, and in this way give examples throughout this little book 
of the most delicate distinctions that are made between the letters: sár, sr; 
ser, ser; SÓT, SŐT; stir, syr. 


7 Eine ältere, deutsche Übersetzung findet sich bei Neckel & Niedner 
(1925:334-348), die allerdings teilweise fehlerhaft ist. 
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A man inflicted a wound (sdr) on me; I inflicted many wounds (sör) on him. 
[...] The priest alone swore (sör) the oaths (séren). Sour (stir) are the sow’s 
(syr) eyes, but better so than if they popped.“ (Haugen 1950:15)® 


In gleicher Weise begriindet der Erste Grammatiker seine graphische 
Unterscheidung zwischen oralen und nasalen Vokalen? und zwischen 
Lang- und Kurzvokalen mittels diakritischer Zeichen. 

Die Ausfiihrungen des Ersten Grammatikers belegen, dass die 
mittelalterlichen Schreiber des Isländischen traditionsgemäß nicht alle 
phonemischen Kontraste in der Schrift unterschieden. Und dass der 
Vorschlag des Ersten Grammatikers sich nicht in der altisländischen 
Orthographie durchsetzte, zeigt, wie hoch die Bedeutung der 
Schreibtradition für die frühe Entwicklung der deutschen Orthographie 
anzusetzen ist. Für die Umlautfrage im Althochdeutschen lässt sich 
bereits aus diesem Text folgendes Argument vom Stärkeren auf das 
Schwächere ableiten: Wenn isländische Schreiber im 12. Jahrhundert 
nicht einmal alle phonemischen Vokalunterschiede orthographisch 
markierten, um wie viel weniger ist dann anzunehmen, dass 
althochdeutsche Schreiber vor dem 12. Jahrhundert alle wichtigen 
subphonemischen Vokalunterschiede orthographisch markierten. In 
Bezug auf die Umlaute von a, o und u bedeutet das: Das völlige Fehlen 
von orthographischen Markierungen für die Umlautallophone [&(:), øC), 
y@)] im frühen Althochdeutschen ist kein Beleg dafür, dass die 
Umlautallophone nicht bereits vorhanden gewesen wären. 

Diese Argumentation lässt sich auch ohne Verweis auf den Ersten 
Grammatiker allein durch Betrachtung des althochdeutschen Phonem- 
Graphemverhältnisses aufstellen: Die Schreiber des Althochdeutschen 
markierten ebenfalls nicht alle phonemischen Unterschiede 
orthographisch. So wurden Vokallänge und -kürze meist nicht markiert, 


8 Kursivschreibung wie bei Haugen (1950); altisländische Wörter in Klammern 
in normalisierter Schreibung, in der Handschrift steht ser statt ser, sør statt sór, 
und es stehen keine Akzentzeichen. 

° Der Erste Grammatiker besteht in seiner Abhandlung darauf, dass 
Nasalvokale von den übrigen Vokalen zu unterscheiden seien und bietet 
Beispielwörter, die sich auf frühere Formen mit nasalem Konsonanten vor dem 
Vokal zurückführen lassen. Nasalvokale sind ansonsten im Altisländischen nicht 
nachzuweisen. 
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es stand ein (e)-Graphem fiir die Vokalphoneme /é, e, &/ sowie vereinzelt 
fiir die Diphthonge /ia, ei, eo, ie/, das Graphem (z) wurde sowohl fiir die 
Affrikate als auch fiir den Frikativ verwendet. Das Besondere an dem 
Text des Ersten Grammatikers ist jedoch der daraus zu entnehmende 
Hinweis, dass die Schreiber durchaus die bedeutungsunterscheidende 
Funktion der Umlaute, also deren Phonemstatus, erkennen konnten, ohne 
daraus Konsequenzen fiir die Schreibung der Umlaute zu ziehen. 

Die historische Verbindung zwischen Umlauten und hinteren Vokalen 
im Deutschen beschrieb womöglich als erster Johannes Kolroß 1530 in 
seinem Enchiridion: das ist Handbüchlin tütscher Orthographi hachtütsche 
sprach artlich zeschryben und läsen: „Der meerentheijl wort / so mit 
nachuolgenden diphthongis / namlich å. 6. ü. und ü geschriben werden / 
haben irren ursprung von anderen worten / welche im anfang a o ou 
unnd u haben“ (Kolroß 1530 zitiert nach Müller 1882:68). Wie schon bei 
dem Ersten Grammatiker, so muss auch hier berücksichtigt werden, dass 
der Begriff Buchstabe lange Zeit nicht nur die Zeichenseite, sondern auch 
die Lautseite umfasste.'° Es wäre falsch zu glauben, dass Kolroß die 
Umlaute als gesprochene Diphthonge auffasste — schließlich wurden 
auch 1530 die Umlaute monophthongisch gesprochen — vielmehr 
bezieht sich Kolroß auf Schreibdiphthonge. Die aus heutiger Sicht 
unklare Unterscheidung zwischen gesprochenem Laut und geschriebenem 
Buchstaben mag man kaum Kolroß persönlich vorwerfen. Auch in 
Zedlers Großem Universal-Lexicon (1732-1754) liest man, ein 
Diphthongus sei „ein aus zweyen selbstlautenden Buchstaben oder 
Vocalen also zusamen gesetzter Buchstabe, daß dererselben Laut in 
einem Ton zusamen ausgesprochen wird“ (Zedler 1732-1754:1027). 

Der Begriff Umlaut taucht zuerst bei Klopstock (1774) auf. Er 
bezeichnet verschiedene Wurzelalternanzen als Umlaut und führt diesen 
Begriff wie folgt ein. 


„Wem solte es undeutlich seyn, wenn ich zum Exempel sagte: Aus Strom 
wird Ströme, und sang aus singen, durch den Umlaut? Wenn aus aä, 
aus o 6, und aus u ii wird, als Kraft Kräfte, floß flösse, Fluß 
Flüsse; so ist der Umlaut bestimt: und wird aus irgend einem 
Selbstlaute irgend ein andrer, als kommen, kam; laufen, lief; 


10 Und wo es nicht besonders auf die Unterscheidung ankommt, verwendet 
man den Begriff Buchstabe umgangssprachlich noch heute so. 
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fliehen, floh; so ist der Umlaut unbestimt?“ (Klopstock 1774, zitiert 
nach der historisch-kritischen Ausgabe 1975:122) 


Was heute als Ablaut bezeichnet wird, ist bei Klopstock ein unbestimmter 
Umlaut, im Gegensatz zum bestimmten Umlaut, dem unser heutiger 
Umlautbegriff entspricht. Die Bestimmtheit eines Umlauts rührt für 
Klopstock von morphologischen Zusammenhängen her, die er bereits 
historisch deutet. 


„Alle einfache und vermehrte Wörter sind Stammwörter. Die lezten 
stammen von den ersten ab, und von jenen wieder andre. Soll Schuld 
Schuldner; kann Kunst Künstler. Welche einfache Wörter aber von 
einander abstammen, kann man nur selten ausmachen. Fliessen (die 
Veränderungssylbe en komt hier nicht in Betrachtung) kann von 
Fluß; aber Fluß kann auch von fliessen abstammen. Hingegen ist der 
bestimte Umlaut (a in ä, o in ö, u in ü) ein unfehlbares Kenzeichen der 
Abstammung, als strömen von Strom.“ (Klopstock 1774, zitiert nach 
der historisch-kritischen Ausgabe 1975:139) 


Die historisch-phonologischen Zusammenhänge der Umlautung hat 
Klopstock allerdings noch nicht beschrieben. Er betrachtet Umlaut 
ausschließlich unter morphologischen oder lexikalischen Aspekten, nicht 
lautgeschichtlich. 

Die Erkenntnis, dass alte i und j in der Folgesilbe mit dem Umlaut in 
engem Zusammenhang stehen, wird gemeinhin Jacob Grimm 
zugeschrieben, der in seiner Deutschen Grammatik den Umlaut auf 
nachfolgendes i, j (allerdings auch späteres e) zurückführt. In der zweiten 
Auflage von 1822 schreibt Grimm: 


„Die von einem folgenden vocale bewirkte trübung (verdünnung) des 
vocals der wurzel heißt nun: umlaut. Man merke: 


a) macht den umlaut zu zeugen wohnt gerade jenem in der mitte 
[d.h. vom Trübungsgrad her zwischen reinen und trüben 
Vokalen; JHS] stehenden i oder dessen doppelung 1 bei. 
Späterhin hat das das i vertretende e dieselbe kraft. Im 
nordischen zieht auch u einen ähnlichen, doch verschiedenen 
umlaut nach sich. Beide i und u können in gewissen fällen 
hinten abgeworfen werden und ihre wirkung, der umlaut, 


bleibt dennoch stehen (versteckter Umlaut); in andern hört mit 
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dem ausfallen des i der umlaut auf, und der anfangliche reine 
vocal kehrt zurück (rückumlaut)“ 


(Grimm 1822:9, Kursivdruck im Original) 


Bereits Grimm geht davon aus, dass es mindestens zwei, zeitlich versetzte 
Umlautphasen gegeben haben muss. Dies begründet er mit dem 
zeitversetzten Auftauchen der Umlautmarkierung für den Kurzvokal a. 


„Die wahrnehmung dieses natürlichen, in dem buchstabenverhältnis 
begründeten stufengangs [der verschiedenen Umlautperioden von a; JHS] 
scheint mir schon hinreichend die meinung abzuweisen, daß der umlaut 
des a in e jederzeit bestanden habe, aber zuerst gar nicht, dann ungenau, 
endlich durchgängig im schreiben bezeichnet worden sey. Warum schrieb 
man denn in der ungenauen zeit niemahls hazi, balid [sic!, wohl 
Druckfehler für baldi; JHS], salida? oder in der ältesten niemahls selbida, 
ermida? Und wirkte das i stets einen wenn auch ungeschriebenen umlaut 
bei dem a, so müste das nämliche für andere vocale behauptet werden, 
deren umlaut später in schrift und aussprache vortritt. Wäre dem aber so, 
warum sollte man sich nicht auch, wenigstens zuweilen, damit abgegeben 
haben, ihn in der schrift auszudrücken? Alth. quellen weisen jedoch kein 
beispiel vom umlaut des â in æ, des 6 in œ, des o in 6, des u in ü, wohl 
aber beginnt der des ü in iu mit dem 10. jahrh. schwankend. Auch scheint 
es mir von jeher der hochdeutschen schreibung eigen gewesen, sich treu 
und soweit die mittel reichen, nach der aussprache zu richten.“ (Grimm 
1822:77£., Kursivdruck im Original) 


Seit den Anfangen der Umlautforschung bei Jacob Grimm, ist eine weite 
und vielfältige Forschungsliteratur über den Umlaut in alt- und 
mittelhochdeutschen Dialekten entstanden. Stand zu Beginn der 
Forschungsgeschichte noch die graphematische Auswertung alt- und 
mittelhochdeutscher Denkmäler und Urkunden im Vordergrund, so 
bemühte man sich Anfang des 20. Jahrhunderts mehr und mehr auch um 
die Interpretation der textlichen Umlautevidenzen innerhalb eines 
theoretischen Rahmens. 

Eines der größten Rätsel und einen der beständigsten Streitpunkte 
bildete dabei die zeitliche Lücke, die festgestellt wurde zwischen dem 
allmählichen Schwinden der umlautbedingenden i-Laute — das schon vor 
Beginn der althochdeutschen Sprachperiode begonnen haben muss — 
und dem größtenteils sehr viel späteren Erscheinen der Umlaut- 
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markierungen in Dokumenten aus spätalthochdeutscher oder gar erst 
mittelhochdeutscher Zeit, also mindestens einem Jahrhundert nach dem 
Schwund der meisten phonologischen Umlautfaktoren. 

Die Datenlage wurde von einigen Sprachforschern so interpretiert, 
dass es zwei zeitlich getrennte Umlautphasen gegeben habe, nämlich die 
des frühen Primärumlauts von ahd. a zu ahd. e und die des späteren 
Sekundärumlauts von mhd. a, â, o, ô, u, i zu mhd. ä, œ, ö, œ, ü, iu (so 
schon Grimm 1822:77f.; später noch explizit z.B. bei Kauffmann 1890; 
Schweikle 1964; Voyles 1991; Iverson & Salmons 1996; Simmler 2000a, 
2000b). Ein Problem, das durchaus gesehen wurde, war, dass die 
umlautauslösenden i-Laute zur Zeit der schriftlichen Markierung des 
Sekundärumlauts schon längst geschwunden waren. Als Lösung wurde 
die Mouillierungstheorie von Scherer (1868:143ff.), Sievers (1901:182) 
und anderen entworfen, wonach zunächst die Konsonanten zwischen 
dem vorausgehenden Vokal und dem nachfolgenden i, j palatalisiert 
(„mouilliert“) wurden und später, nach dem Schwund von i j, den 
vorausgehenden Stammvokal umlauteten, indem sie wiederum ihre 
Palatalität auf den Stammvokal übertrugen. Jedoch konnte diese Theorie 
nicht voll überzeugen, vor allem weil sich von den angeblich 
palatalisierten Konsonanten keine weiteren Spuren in der übrigen 
Sprachgeschichte der germanischen Sprachfamilie finden." 

Auf ganz andere, neue Weise erklärte Twaddell (1938) im Rahmen 
einer strukturalistischen Analyse den Umlautprozes. Demnach 
entstanden zeitgleich palatale Allophone aller hinteren Vokale in 


11 In der aktuellen Ausgabe der Althochdeutschen Grammatik (Braune & 
Reiffenstein 2004) wird in 851, Anm. 1b behauptet, dass die Mouillierungstheorie 
„den Umlaut durch i in dritter Silbe (fravali u.a. [...])“ nicht erkläre. Jedoch ist bei 
allen einschlägigen althochdeutschen Formen, in denen der Umlaut durch i in 
dritter Silbe ausgelöst wurde, der Mittelsilbenvokal ganz zu i gehoben: ahd. frevili, 
negili, edili usw. Es finden sich gerade keine *frevali, *negali, *edali, bei denen der 
Vokal der mittleren Silbe nicht bereits „mouilliert“ wäre. Dieser palatalisierte 
Mittelsilbenvokal hätte laut Mouillierungstheorie die vorangehenden Konsonanten 
palatalisieren und diese wiederum den Stammvokal umlauten können. Die 
Datenlage würde also nahelegen, dass die unbetonten Vokale zu schwach waren, 
um Widerstand gegen ihre Palatalisierung zu leisten, während die Stammvokale 
stark genug waren, um sich bis ins Mittelhochdeutsche hinein ihrer Palatalisierung 
zu erwehren. 
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betonter Stellung, wenn ein i-Laut in der nächsten Silbe folgte. Diese 
palatalen Allophone wurden jedoch in der Schrift nicht bezeichnet mit 
Ausnahme des Umlauts a zu e, der aufgrund seiner lautlichen Nähe zum 
altererbten Vokal ë wie dieser mit dem lateinischen Buchstaben (e) 
wiedergegeben wurde. Erst mit der Reduktion der i-haltigen Nebensilben 
ergab sich die Notwendigkeit, die neu entstandenen Umlautphoneme 
auch schriftlich zu markieren. Obwohl also in den Dokumenten die 
Umlautmarkierungen zeitlich versetzt auftreten, gab es nur eine 
einheitliche Umlautperiode in der alle velaren Vokale palatale Varianten 
entwickelten. Die Übersicht in (1) zeigt, wie die Beleglage zu den 
Kurzvokalen in den alt- und mittelhochdeutschen Denkmälern nach 
Twaddells phonemischen Ansatz zu interpretieren ist. 


(1) Umlaut als Phonemisierung von Allophonen (hier: der Kurzvokale) 
(Tabelle frei nach Simmler 2000b:1323 Abb. 90.1, mit 
entscheidenden Unterschieden bei der Allophonie des /a/) 


Althochdeutsch Mittelhochdeutsch Nhd. 


Lexem | Graph | Phon | Phonem | Lexem | Graph | Phon | Phonem | Lexem 


gast (a) [a] gast (a) [a] /a/ Gast 
mahti | (a) [a] > /a/ |madhte | (a) [a] |/æ/ Mächte 


gesti (e) [e] geste (e) [e] /e/ Gäste 
bogo (0) [o] boge (0) [ol |/6/ Bogen 
pocchili | (o) [ø] F> /0/ böckelin | (6) [ø] | /6/ Böcklein 
brunno | (u) [u] brunne | (u) [ul | /u/ Brunnen 
brunnia | (u) [y] P w brünne | (ti) [y] | /ii/ Briinne 


Twaddells Ansatz wurde durch weiterfiihrende Arbeiten, nicht zuletzt 
jener von Penzl (1949; 1983; 1994; 1995), Marchand (1956; 1990), 
Antonsen (1964; 1961), zur anerkannten Standardtheorie der 
Entwicklung des althochdeutschen Umlauts. Die zeitliche Lücke zwischen 
den verschiedenen Umlautmarkierungen in der Orthographie schien 
damit den meisten Sprachwissenschaftlern plausibel und vor allem 
theoretisch fundiert erklart. 

Allerdings regte sich auch nach Twaddells phonemischer Erklarung 
stets Widerstand gegen die Idee, dass die in der gesprochenen Sprache 
vorhandenen Umlautvokale nicht in der Schrift von unumgelauteten 


29 


Vokalen unterschieden worden sein sollten (z.B. Kratz 1960; Schweikle 
1964; Voyles 1977, 1991; Buccini 1992; Iverson & Salmons 1996, 1999; 
Simmler 2000a, 2000b; Salmons 2008). Die Grundargumentation blieb 
dabei stets die gleiche wie schon bei Grimm: Wenn die 
mittelhochdeutschen Schreiber neue Zeichen für die Umlautvokale 
erfinden konnten, dann hätten das auch die althochdeutschen Schreiber 
tun können oder sie hätten wenigstens hin und wieder die Umlautvokale 
in der Schrift andeuten müssen. Man dürfe nicht die empirische 
Datenlage, d.h. die belegten Schreibungen der althochdeutschen 
Denkmäler, aus theoretischen Überlegungen heraus uminterpretieren. 
Gerade die neueren Ansätze zur Erklärung des Umlauts aus den letzten 
Jahren und Jahrzehnten lehnen mindestens eine der folgenden zwei 
wesentlichen Annahmen des strukturalistischen Ansatzes ab, dass 
nämlich der Umlautprozess (1.) nur während der althochdeutschen 
Periode gewirkt habe und (2.) rein phonologisch durch nachfolgendes i 
oder j zu erklären sei. 

Die Umlautdiskussion der letzten Jahrzehnte führte jedoch auch zu 
einer stärkeren Konzentration auf einige besondere Details der 
Umlautentwicklung. So lässt sich etwa feststellen, dass der 
Sekundärumlaut auf a je nach Dialektgebiet unterschiedlich stark und 
zeitlich versetzt wirkte. Dieser Umstand war zwar schon seit Beginn der 
Umlautforschung bekannt (Henning 1874:110; Wagner 1876:51; Kögel 
1879:2; Kossinna 1881:20; Wüllner 1882:77; Socin 1883:217; Kauffmann 
1890:49f.; Schatz 1899:2f., 1907:821; Fasbender 1908:57; Franck 
1909:22f.), wurde jedoch mit dem Siegeszug des strukturalistischen 
Ansatzes der theoretischen Erörterung mehr oder weniger entzogen. Die 
Details der Umlautchronologie ergaben sich aus Sicht der Vertreter des 
strukturalistischen Ansatzes einfach aus siedlungsgeschichtlichen 
Entwicklungen, morphologischen Ausgleichstendenzen, klösterlichen 
Schreibtraditionen und dem Dialekt des Schreibers, sofern es den 
Forschern überhaupt gerechtfertigt erschien, diese Einzelheiten aus den 
wenigen althochdeutschen Denkmälern abzuleiten, die doch bestenfalls 
phonemische, nicht jedoch allophonische Unterschiede wiedergeben 
konnten. 

Für einige neuere Ansätze spielen die Unterschiede in Ausbreitung 
und Wirkung des Umlauts eine besonders wichtige Rolle. Diese 
Feinheiten müssten, so die Herausforderer des strukturalistischen 
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Ansatzes, einer genauen typologischen Untersuchung unterzogen werden. 
Die einen schlagen eine phonetische, andere eine morphologische Lösung 
vor. Was die neuen Theorien eint, ist die große Skepsis gegenüber der 
Annahme, es habe nur eine einzige Umlautperiode gegeben. Je nachdem, 
wie man sich in dieser Frage entscheidet, stehen oder fallen die neueren 
Ansätze, die von mehreren Umlautperioden ausgehen. In der 
vorliegenden Arbeit soll gezeigt werden, dass es im Deutschen nur eine 
einzige i-Umlautperiode gegeben hat und dass diese auf die 
athochdeutsche Zeit beschränkt ist. 


4. Aufbau der Arbeit 


In Teil II Primär- und Sekundärumlaut als Forschungsproblem wird 
ausführlich die immer noch aktuelle Frage besprochen, ob zunächst der 
Primärumlaut a > e auftrat und später der Sekundärumlaut der übrigen 
velaren Vokale, oder ob nicht doch alle hinteren Vokale gleichzeitig 
umgelautete Varianten entwickelten. Verteidigt wird dabei die 
Standardtheorie zum i-Umlaut, wonach i und j den Umlaut aller 
vorausgehenden velaren Vokale bewirkte, wobei von dieser 
allophonischen Variation zunächst nur der Umlaut des a zu e in der 
Schrift wiedergegeben wurde und für die übrigen Umlautvokale erst nach 
deren Phonemisierung eigene Grapheme entwickelt wurden. Folgende 
Aspekte, die in letzter Zeit gegen die Standardtheorie vorgetragen 
wurden, werden behandelt: 

e Fragen der Graphemik (Warum wurde der Umlaut nicht in der 
Schrift markiert, obwohl die Umlautvokale bereits entwickelt 
waren?), 

e das Problem der Falsifizierbarkeit (Wie soll eine Theorie 
widerlegt werden, die durch das Fehlen orthographischer 
Evidenz verifiziert wird?), 

e Schwierigkeiten der phonologischen Regelbildung (Wie können 
Primär- und Sekundärumlaut durch eine einzige phonologische 
Regel beschrieben werden?), 

e Umlautreflexe in den modernen Nachfolgedialekten (Warum 
wurden die Umlautvokale nicht einheitlich phonemisiert?), 
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e das Verhältnis des Umlauts zu germanischer Hebung und 
Senkung (Markiert der Primärumlaut den Übergang von der 
germanischen Vokalhöhenassimilation zur althochdeutschen 
Palatalharmonie?), 

e eine vereinfachte Theorie zur phonetischen Basis des Umlauts 
(Deuten phonetische Untersuchungen zur Koartikulation darauf 
hin, dass der Primärumlaut vom Sekundärumlaut systematisch 
zu trennen ist?), 

e die Phonemisierung des Umlauts und die morphologischen 
Einflüsse auf die Ausbreitung des Umlauts (Warum fehlt der 
Umlaut seit frühester Zeit in bestimmten morphologischen 
Klassen?). 


Die Idee, dass Koartikulation die phonetische Grundlage für die 
Entwicklung des Umlauts im Althochdeutschen ist, wird in Teil III 
aufgegriffen. Wie sich zeigen wird, sprechen die bisherigen 
Forschungsergebnisse zur Koartikulation recht eindeutig für die 
Standardtheorie des i-Umlauts. Zentral für den Zusammenhang von 
Koartikulation und Umlaut im Althochdeutschen sind dabei folgende 
Aspekte: 

e Die gemessenen Daten zur intervokalischen Koartikulation bei 
heutigen Sprechern weisen deutliche Parallelen zu den 
Umlautdaten in alt- und mittelhochdeutschen Texten auf. Die 
Null-Hypothese muss daher sein, dass intervokalische 
Koartikulation die phonetische Grundlage des Umlauts darstellt. 

e Neben den sprecherseitigen Aspekten ist auch die hörerseitige 
Kompensation der Koartikulation zu berücksichtigen. Hörer 
beziehen bei der kognitiven Verarbeitung des Sprachschalls 
bereits ein, dass Koartikulation in natürlichen Sprachen auftritt. 
Die Art und Weise, wie Hörer Koartikulation kompensieren, 
hängt dabei wesentlich von ihrer Muttersprache bzw. ihrem 
Dialekt ab. 

e Nur die Synthese aus sprecherseitiger Koartikulation und 
hörerseitiger Kompensation der Koartikulation ermöglicht eine 
phonetische Erklärung der Umlautphonemisierung. Kurz 
zusammengefasst: Das Unterbleiben der 
Koartikulationskompensation bei einer späteren Sprecher- 
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generation ist auf phonetischer Ebene der entscheidende Schritt 
zur Phonemisierung der Umlaute. 


In Teil IV Ansatz zu einer Umlauttypologie wird eine allgemeine Definition 
fiir Umlautphänomene vorgeschlagen und mit anderen 
Begriffsbestimmungen verglichen. Neu an der vorgeschlagenen Definition 
ist der Bezug auf Schwächeposition. 

Schwächepositionen sind: 

e der Endrand einer betonten Silbe, 

e die postinitiale Position zwischen anlautendem Konsonant und 

Nukleus in betonten Silben, 

e alle Positionen innerhalb einer unbetonten Silbe. 
In Schwächepositionen werden Laute abgebaut, d.h. sie werden reduziert 
oder schwinden. Der Vokal i und der Halbvokal j bewirken nur dann den 
Umlaut benachbarter velarer Vokale, wenn sie in einer solchen 
Schwächeposition stehen. Außerdem muss für jeden Umlaut eine 
bestimmte Domäne als Wirkungsbereich angegeben werden, etwa die 
Silbe, der Fuß oder das prosodische Wort. Eine intervokalische 
Assimilation gilt dann als Umlaut, wenn sie von einer Schwächeposition 
ausgeht und innerhalb einer eingeschränkten Domäne wirkt. 

Nach der vorgeschlagenen Definition wirkt ein Umlaut nicht nur 
regressiv (von rechts nach links), sondern auch progressiv (von links 
nach rechts). Der Wandel germ. *ja > ahd. e ist nach dieser Auffassung 
ebenso ein Umlautphänomen wie die Diphthongverengung germ. *ai > 
ahd. ei. 

Neben i und j lösen im Althochdeutschen auch u und o einen Umlaut 
aus. Auf der Grundlage des neu formulierten, allgemeinen Umlautbegriffs 
werden phonologische Bedingungen für einen althochdeutschen u/o- 
Umlaut festgelegt, der bei der Monophthongierung von ahd. iu zu [y:] 
mitwirkt und sich in der Diphthongverengung germ. *au > ahd. ou, dem 
Lautwandel germ. *aww > ahd. ou(w) und der Monophthongierung ahd. 
ao > 6 im Auslaut zeigt. 


Die Ergebnisse der Untersuchungen zum Umlaut miinden in Teil V 
Optimalitdtstheoretische Analyse des althochdeutschen i-Umlauts, in dem der 
althochdeutsche i-Umlaut als Interaktion universaler, verletzbarer 
Beschränkungen aufgefasst wird. Dazu wird zunächst die 
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Grundkonzeption der Optimalitätstheorie kurz dargestellt und die 
Interaktion von Markiertheits- und Treuebeschränkungen besonders 
erläutert. 

Zur Abbildung des Umlauts im Althochdeutschen wird die 
Beschränkungsfamilie AGREE-[F] verwendet, die von benachbarten 
Segmenten fordert, dass sie hinsichtlich eines Merkmalswertes [F] 
übereinstimmen. Es wird davon ausgegangen, dass Assimilationen immer 
nur lokal wirken und nicht einzelne Laute überspringen können. Die 
Wirkung der AGREE-Beschränkungen wird durch Treuebeschränkungen 
der Familie IpEnT-[F] kontrolliert, nach denen Input- und 
Outputsegmente hinsichtlich ihres Wertes für das Merkmal [F] 
übereinstimmen müssen. Die wichtigsten Beschränkungen zur Abbildung 
des Umlauts in der Optimalitätstheorie sind dabei: 

e  AGREE-[hinten] 

‘Benachbarte Segmente innerhalb eines Wortes müssen 
hinsichtlich ihres Wertes für das Merkmal [hinten] 
übereinstimmen.’ 

e _AGREE„-[tief] 

‘Benachbarte Segmente innerhalb eines prosodischen Wortes 
müssen hinsichtlich ihres Wertes für das Merkmal [tief] 
übereinstimmen.’ 

e _ [IDENT-[tief] & IDENT-[tief]], 

Eine lokale Selbstkonjunktion der Treuebeschränkung 

IDENT-[tief], wonach innerhalb eines Fußes der Merkmalswert 

[tief] nur einmal, nicht aber zweimal verändert werden darf. 
Der Umlaut im Althochdeutschen macht die Einschränkung der AGREE- 
Beschränkungen auf prosodische Wörter notwendig. Da der i-Umlaut in 
besonderer Weise mit der Prosodie im Althochdeutschen interagiert, ist 
in Teil V ein Exkurs eingeschoben, in dem die Fußstruktur, prosodische 
Wortgrenzen und prosodische Besonderheiten bei bestimmten Affixen im 
Rahmen der Optimalitätstheorie rekonstruiert werden. 

Die folgenden Ausnahmen beim i-Umlaut hinsichtlich des Vokals a 
lassen sich auf das Wirken der lokalen Selbstkonjunktion 
[IDENT-[tief] & IDEnT-[tief]], zurückführen. Die Hebung a > e unterbleibt 
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e bei langem [a:],'? 

e wenn [i] erst in dritter Silbe steht, 

e vor bestimmten Konsonanten, besonders vor (h), (r) oder (1). 
Würde der Vokal a in diesen drei Fällen zu e gehoben, so verstieße die 
Hebung gegen die lokale Selbstkonjunktion, da der Merkmalswert [tief] 
zweimal innerhalb des Fußes geändert würde. 

Dass die Hebung von a zu e vor den Suffixen -lih und -nissi 
unterbleibt, wird durch ihren besonderen Status als Klasse-II-Affixe 
erklärt. Als Klasse-II-Affix bilden sie ein eigenes prosodisches Wort und 
können nicht die Hebung eines a in einem anderen prosodischen Wort 
bewirken. 


In Teil VI wird die Untersuchung des i-Umlauts mit einer 
Zusammenfassung der wichtigsten Ergebnisse abgeschlossen. 


12 Im Folgenden richtet sich die phonetische Transkiption nach den 
Zeichenkonventionen des IPA. Insbesondere wird ein Unterschied gemacht 
zwischen [a], das hinten artikuliert wird, und [a], das vorne artikuliert wird. 
Ersteres steht für unumgelautete a, letzteres für das Sekundärumlaut-ä des Kurz- 
und des Langvokals. 
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Teil ll Primär- und Sekundärumlaut als 
Forschungsproblem 


1. Drei Hypothesen zum i-Umlaut 


Teil II beschäftigt sich mit der grundlegenden Frage, ob Primär- und 
Sekundärumlaut chronologisch getrennte Lautwandelprozesse waren oder 
ob ein einheitlicher Lautwandel alle velaren Vokale gleichzeitig 
umlautete. Die Entscheidung in dieser Frage hat gravierende 
Konsequenzen für jede weitere Theoriebildung über den 
althochdeutschen i-Umlaut. Die in dieser Arbeit verteidigten Hypothesen 
zum althochdeutschen i-Umlaut werden um der Klarheit Willen in (2) 
festgehalten. Sie bilden so etwas wie die Standardtheorie des 
althochdeutschen i-Umlauts, die im Allgemeinen auf Twaddell (1938) 
zurückgeführt wird und die später unter anderem von Penzl (1949; 1983; 
1994; 1995), Marchand (1956; 1990), Antonsen (1961; 1964) weiter 
detailliert und ausgebaut wurde.'? 


(2) Hypothesen zum althochdeutschen i-Umlaut (Standardtheorie) 


(2a) i und j sind die ursprünglichen Auslöser des Umlauts im 
Althochdeutschen (phonetische Hypothese). 


(2b) Zu Beginn der althochdeutschen Sprachperiode treten bereits 
alle Umlaute als allophonische Varianten auf (phonemische 
Hypothese). 


(2c) Die allophonischen Umlautvarianten werden anfangs nicht in 
der Schrift wiedergegeben. Die Markierung des Umlauts setzt 
frühestens ein, als die Umlautalternanzen bedeutungs- 
unterscheidende Funktion übernehmen (graphemische 
Hypothese). 


13 Die einzelnen Versatzstücke dieser Erklärung gehen zwar nicht originär auf 
Twaddell selbst zurück, jedoch hat er die einzelnen Ideen erstmals zu einer 
kohärenten Hypothese zusammengeführt. 
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Die Hypothesen der Standardtheorie unter (2) können auf phonetischer, 
phonologischer und graphemischer Ebene angegriffen werden. Die 
phonetische Ebene betrifft Hypothese (2a), dass i, j die ursprünglichen 
Auslöser des Umlauts sind. Sie ist Grundlage der meisten Umlauttheorien, 
wurde aber von verschiedenen Autoren dahingehend kritisiert, dass 
bereits im Frühalthochdeutschen morphologische Bedingungen für den 
Umlaut zu berücksichtigen seien (Dal 1967a, 1967b; Robinson 1975, 
1980; Coetsem & McCormick 1982; Voyles 1991, 1992b; Janda 1998). 
Dagegen wird hier angenommen, dass die Spuren der Umlautprozesse in 
den morphologischen Klassen nachträglich inter- und 
intraparadigmatisch systematisiert wurden, dass also alle morpho- 
syntaktischen Prozesse chronologisch und systematisch nachgeordnet 
sind. Die Umlaute sind sicherlich nicht aufgrund morpho-syntaktischer 
Regeln entstanden (wie Voyles 1991; 1992b meint), sondern die 
Bedeutung der Morphologie für die Ausbreitung der Umlaute setzt erst 
nach der Phonemisierung der Umlaute ein. Indem Hypothese (2a) die 
artikulatorischen Voraussetzungen für Umlaut formuliert, betrifft sie die 
subphonemischen Umlautbedingungen, bei denen es um Artikulation und 
gegenseitige Beeinflussung von Lauten geht. Die 
artikulationsphonetischen und auditiven Aspekte des Umlauts werden in 
Teil III ausführlich besprochen. 

In der Hypothese (2b), dass zu Beginn der althochdeutschen 
Sprachperiode bereits alle Umlaute als allophonische Varianten auftreten, 
geht es um systematische Bezüge zwischen den einzelnen Lauten im 
Vokalsystem der Sprecher des Althochdeutschen. Auch wenn man i, j als 
phonetische Umlautauslöser anerkennt, kann man die phonologische 
Hypothese (2b) ablehnen. So stimmen Iverson & Salmons (1996) zwar 
Hypothese (2a) zu, behaupten aber gleichzeitig, der Umlaut habe sich 
vom Althochdeutschen bis zum Mittelhochdeutschen allmählich unter 
bestimmten phonologischen Bedingungen ausgebreitet. Sie unterscheiden 
auf phonologischer Ebene nicht nur zwischen Primär- und 
Sekundärumlaut, sondern betrachten jeden der Umlaute von a, 4 0, 6, u, 
ü einzeln und gehen davon aus, dass sich zunächst Umlaute von a, dann 
von o und erst zuletzt von u ausgebildet hätten (Iverson & Salmons 
1999:213). Die entscheidende Frage dabei ist, ob der Umlaut mit oder 
ohne Hypothese (2b) besser zu erklären ist. Unter der Annahme, dass 


38 


Hypothese (2b) zur Erklarung des Umlauts notwendig ist, werden weitere 
phonologische Aspekte in Teil III besprochen. 

Die graphemische Hypothese (2c), dass die Markierung des Umlauts 
erst einsetzt, nachdem die Umlautalternanzen 
bedeutungsunterscheidende Funktion übernommen haben, ist der 
gemeinsame Ausgangspunkt aller Ansätze, die keinen Unterschied 
zwischen Primär- und Sekundärumlaut machen. Mit ihrer Hilfe kann 
zwischen althochdeutschen Sprechformen und althochdeutschen 
Schreibformen unterschieden werden. Allerdings wird dies von einigen 
Sprachhistorikern als philologischer Fehltritt, als Missachtung der 
empirischen Evidenz althochdeutscher Dokumente gewertet, da 
Unterschiede auf lautlicher Ebene angenommen werden, wo keine 
orthographischen Unterschiede zu finden sind (Schreibungspositivismus, 
z.B. Simmler 2000a, 2000b). Dieser Vorwurf bezieht sein Gewicht aus der 
Tatsache, dass die althochdeutschen Schriftstücke die wichtigste 
empirische Grundlage für die Rekonstruktion der Lautverhältnisse im 
Althochdeutschen darstellen. Mit Hilfe der Hypothese (2c) werden 
dagegen unter Heranziehung der rekonstruierten, empirisch nicht 
belegten Lautverhältnisss des Germanischen Umlaute im 
Althochdeutschen postuliert, für die es keine direkte empirische Evidenz 
aus althochdeutscher Zeit gibt. Erst die Umlautreflexe in späteren 
Sprachperioden lassen sich empirisch belegen. Diese Lücke zwischen 
rekonstruiertem Germanischen und späteren Umlautreflexen zu 
schließen, ist die zentrale Aufgabe der Hypothese (2c). 

In der argumentativen Praxis sind die Hypothesen (2a), (2b) und (2c) 
oft nicht scharf zu trennen und greifen meist ineinander über. Dennoch 
handelt es sich um Hypothesen auf unterschiedlichen Ebenen der 
Sprachbeschreibung, nämlich Phonetik, Phonologie und Graphemik. Im 
Folgenden werden die wichtigsten Argumente pro und contra abgewogen. 


2. Schreibungspositivismus und Graphemik 


Das schreibungspositivistische Argument, das Voyles (1991; 1992b), 
Iverson & Salmons (1996), Simmler (2000a; 2000b) und andere gegen 
die strukturalistische Standardtheorie vorbringen, hat die philologische 
Forschungstradition hinter sich. Für jeden subphonemischen Unterschied, 
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den man für das Althochdeutsche annimmt, ließe sich, so das Argument, 
wenigstens in einigen Dokumenten eine orthographische Schwankung 
finden. Jedoch erscheinen in keinem althochdeutschen Text vor 1000 n. 
Chr. Anzeichen für einen anderen Umlaut außer dem von a zu e. So 
schreibt beispielsweise erst Notker um die Jahrtausendwende den 
Unterschied zwischen [u:] und [y:]. Aber auch bei ihm findet sich keine 
Schreibung für [ø:] gegenüber [o:]. Alle i-Umlaute müssten, so die 
Schlussfolgerung, wenigstens in einigen Dokumenten sporadisch markiert 
werden, sobald sie in der gesprochenen Sprache auftreten. Solange die 
orthographischen Markierungen fehlten, dürfe man nicht einfach davon 
ausgehen, dass der Umlaut lediglich nicht schriftlich fixiert worden sei. 
Vielmehr existiere dann der Umlaut zum Zeitpunkt der Niederschrift 
auch in der gesprochenen Sprache noch nicht (Voyles 1991:163, 
1992b:367). Dieser Auffassung nach lässt sich die Entstehung der i- 
Umlaute recht einfach und genau an den alt- und mittelhochdeutschen 
Denkmälern ablesen. Zumindest kann für jeden einzelnen Umlautvokal 
ein terminus ante quem empirisch festgestellt werden (zur Methodik 
Simmler 20003; Simmler 2000b; zum strukturalistischen Gegenentwurf 
Penzl 1971b; Penzl 1982). 

Nun wurde bereits vor Twaddells Zeit so argumentiert. Und gerade 
durch die eineindeutige Zuordnung von einem Laut zu einem Buchstaben 
entstand jenes Problem, das Twaddell in seinem Aufsatz löste. Da davon 
auszugehen ist, dass der Umlaut phonetisch durch i j in der Folgesilbe 
bedingt ist, musste erklärt werden, warum er im Althochdeutschen zwar 
schon durchgeführt, aber noch nicht schriftlich markiert war.'* Da die 
Markierung der i-Umlaute über die mittelhochdeutsche Zeit hinaus 
sporadisch und uneinheitlich bleibt, kann eine eindeutige Schreibung 
dieser Vokale auch nach ihrer Phonemisierung nicht notwendig gewesen 


14 Dass i und j überhaupt die Umlautauslöser sind, dementiert Voyles und 
beschreibt in seiner Theorie die Ausbreitung des Umlauts unter Verwendung von 
morphosyntaktischen Regeln - beginnend mit teils phonologischem, teils 
morphologischem Umlaut /a/ > /e/, und später rein morphologischer 
Ausbreitung der Umlaute /u/ > /y/ und /o/ > /@/. Die Regeln bilden dann zwar 
die Ausbreitung des Umlauts in der Orthographie vom Alt- bis zum 
Mittelhochdeutschen ab, allerdings kann Voyles so nicht erklären, weshalb 
Umlautschreibungen regelmäßig dort auftauchen, wo früher einmal i, j standen. 
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sein. Die betroffenen Wörter wurden schließlich auch ohne eigene 
Umlautzeichen zuverlässig erkannt, da das geschriebene (i) der Folgesilbe 
den Umlaut des vorangehenden Vokals bereits andeutete, wenn nicht 
sogar eindeutig markierte (Fertig 1996:178f.). Zudem ist die 
Konservativität der althochdeutschen Orthographie spätestens seit 
Sonderegger (1961) belegt. Wie Sonderegger anhand St. Galler Urkunden 
und deren Vorakten feststellte, wurde der Umlaut a > e zwar nicht in 
den offiziellen Urkunden geschrieben, aber so gut wie immer in den 
weniger formellen Vorakten, und dies bereits seit 764 n. Chr. Die 
konservative Schreibsprache des alemannischen Raums, die einen 
Großteil der althochdeutschen Überlieferung ausmacht, vermeidet 
offensichtlich bewusst Umlautschreibungen, die andererseits in 
informellen Notizen durchaus möglich sind. Vor diesem Hintergrund 
wird der Ansatz eines einigermaßen zuverlässig eingrenzenden terminus 
ante quem non auch über alemannische Textbelege hinaus fragwürdig. Zu 
bedenken ist, dass für andere Textsorten als Urkunden und für sämtliche 
nicht-alemannischen Dialekte einfach keine Vorakte oder vergleichbaren 
Texte überliefert sind und daher nicht auszuschließen ist, dass die 
Schreiber andernorts genauso konservativ schrieben. Der Zeitpunkt für 
das Einsetzen des Umlauts kann jedenfalls immer nur für die 
Orthographie, nicht aber für die Phonologie bestimmt werden. Eine 
orthographische Markierung der phonetischen Unterschiede zwischen 
{u(:)] und [yG)], [oG)] und [@(:)] oder [aG)] und [aG)] erschien den 
althochdeutschen Schreibern offenbar nicht notwendig. Es verbot sich 
den offiziellen Schreibern geradezu, neue Schreibungen zu erfinden oder 
gar neue Schriftzeichen oder Buchstabenkombinationen zu setzen, da nur 
die überlieferten Schreibweisen eine langfristige sowie überregionale 
Lesbarkeit der Schriftstücke garantierten. Bedenkt man weiterhin, dass 
die Einführung der Umlautgraphien ein ungesteuerter Prozess unter 
zahlreichen Akteuren war, der ohne autoritäre Anleitung von 
Schreibergeneration zu Schreibergeneration vonstatten ging, so ist es 
nicht verwunderlich, dass sich neue Umlautmarkierungen nur zögerlich 
durchsetzten. Lag aber eine geeignete Schreibung für einen Umlautvokal 
auf der Hand, wie etwa (e) für das Umlaut-e (gesprochen als [e]) oder die 
Doppelvokalschreibung (iu) für den Langvokal [y:] nach der 
Monophthongierung [iu] zu [y:], so setzte sich diese Schreibung 
aufgrund ihrer funktionalen Nützlichkeit schnell durch. Interessant an 
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letzterem Beispiel ((iu) entspricht [y:]) ist nun wieder, dass die alte 
Schreibung (iu) überhaupt erst durch die konservative Orthographie 
erhalten blieb und so zu einem Zeichen für [y:] werden konnte. Man 
hätte auch einfach (u) schreiben können, wie bei den Allophonen [u:, y:] 
des Phonems /u:/. 

Nun lassen sich durchaus Beispiele fiir subphonemische Schreibung 
im Althochdeutschen finden (Voyles 1976:274f., 1991:161f., 1992b:367; 
Moulton 1987). Diese sind aber kein hinreichendes Argument fiir die 
schreibungspositivistische Umlautdeutung. Bei den auf Allophonie 
zurückzuführenden Schreibvarianten im Althochdeutschen fällt auf, dass 
die Zuordnung von Lauten und Buchstaben aus bereits vorhandenen 
Schreibungen bekannt war. Es ist nicht erstaunlich, dass Otfrid nicht- 
aspiriertes [k~] in [fisk~] als (fisg) und aspiriertes [k"] in [kuning] als 
(kuning) schreibt oder dass im Zweiten Reichenauer Glossar der velare 
Nasal in (chunnigges) als (gg) erscheint. Hier wurden die schon 
vorhandenen Buchstaben so kombiniert, dass die Abweichungen ihrer 
Lautmerkmale von der bekannten Aussprache minimal waren. In gleicher 
Weise wurde die Diphthongierung von germ. ö ganz selbstverständlich 
mit der jeweils passenden Buchstabenkombination in der Schrift 
nachvollzogen und es tauchen nach Ende des 8. Jahrhunderts die 
Schreibungen (oa, ua, uo) auf. Keinesfalls sind diese Schreibungen zu 
vergleichen mit der Einführung eines Graphems (oi) oder (io) für [9] oder 
[ø:], das ja nach traditioneller Lautzuordnung als diphthongisches [oi] 
bzw. [io] hätte gesprochen werden müssen. Besonders deutlich wird dies 
bei den Kurzvokalen /a, œ, y/ in offener, also einmoriger Silbe. Durch 
einen angedeuteten Diphthong würde der Schrift nach aus der 
einmorigen eine zweimorige Schreibsilbe entstehen mit diphthongischem 
(ai), (oi) oder (ui), was Schreibern einer quantitierenden Sprache als 
erheblicher Nachteil erscheinen muss. So setzt sich denn auch erst mit 
dem Zusammenbruch der Quantität im Spätmittelalter (zur 
Quantitätsproblematik vgl. Vennemann 1995) die diphthongische 
Schreibung für die kurzen Umlautvokale vollends durch. 
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3. Fehlende Falsifizierungsmöglichkeiten 


Der Standardtheorie wurde namentlich von Voyles (1991:167f.) 
folgendes wissenschaftstheoretische Problem vorgeworfen. Die Annahme, 
Umlautallophone blieben in der Schrift zunächst unmarkiert, werde nur 
durch das Fehlen jeglicher orthographischer Umlautmarkierungen 
bestätigt. Das Fehlen von Evidenz könne jedoch nicht als Bestätigung 
einer wissenschaftlichen Hypothese gewertet werden. Nur 
althochdeutsche Dokumente, die sich explizit mit der Verschriftlichung 
von Sprache oder der korrekten Aussprache von Buchstaben befassen, 
könnten Twaddells Theorie direkt widerlegen. Jedoch äußert sich Otfrid 
in seinem Approbationsgesuch an Erzbischof Liutbert, dem einzig 
bekannten Text mit Erklärungen eines damaligen Schreibers zur 
althochdeutschen Lautung, nicht zur Aussprache oder Schreibung der 
fraglichen Vokale (Penzl 1971a:20). Da auch nicht mit dem Auftauchen 
weiterer Texte mit orthoépischen Beschreibungen aus althochdeutscher 
Zeit gerechnet werden kann, scheidet diese Möglichkeit der Verifikation 
oder Falsifikation aus. 

Die Frage lautet also: Sollte man auf eine Theorie lieber verzichten, 
wenn sie wahrscheinlich empirisch nicht widerlegt werden kann? Voyles 
(1991:168) jedenfalls nennt die Standardtheorie deshalb „a nonscientific 
theory“. Darauf ist nun zweierlei zu erwidern: Zum einen wird mit 
diesem Vorwurf der Falsifikationismus von den Naturwissenschaften auf 
die historische Linguistik übertragen und behauptet, dass nur 
falsifizierbare Aussagen wissenschaftlich seien. Ob diese Übernahme 
überhaupt sinnvoll und zulässig ist, muss bezweifelt werden. Die 
empirischen Daten können in den Naturwissenschaften anhand von 
Experimenten ermittelt werden. In der historischen Phonologie gibt es 
bekanntermaßen keine experimentelle Basis. Da es keinen direkten 
Zugriff auf die tatsächliche Aussprache des Althochdeutschen gibt, wird 
die Rekonstruktion der Lautung aus den Schriftbelegen stets eine 
Interpretationsaufgabe sein. Daher ist die selbst auferlegte Restriktion des 
Falsifikationismus unnötig und verfehlt. Zum zweiten ist aber die 
Hypothese, die Schrift müsse allophonische Variation widerspiegeln, 
nicht besser falsifizierbar als Twaddells Theorie. Denn empirisch 
falsifizierbar sind lediglich Datumsangaben bezüglich der Ausbreitung 
von Graphemen über die Flexionsklassen, keinesfalls aber die Zuordnung 
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von bestimmten Phonemen zu jenen Graphemen. Welche Lautungen mit 
den Graphemen (a, o, u) im Althochdeutschen korrespondieren, entzieht 
sich einer empirischen Überprüfung. Da jedoch auch in den heutigen 
Schreibsystemen nicht alle allophonischen Variationen wiedergegeben 
werden, ist es schließlich plausibler anzunehmen, dass auch im 
Althochdeutschen nicht alle allophonischen Variationen ihren 
Niederschlag in der Schrift fanden. 


4. Adäquate Umlautregeln 


Verschiedentlich wurde darauf hingewiesen, dass bisher keine genaue 
Regel formuliert wurde, die die Entstehung und Entwicklung des i- 
Umlauts vollständig beschreiben würde (Voyles 1991:164f., 1992b:268f.; 
Iverson & Salmons 1996:78-81). Das daraus abgeleitete Argument gegen 
die strukturalistische Standardtheorie lautet dann, dass primärer und 
nicht-primärer Umlaut keinen einheitlichen phonologischen Prozess 
bilden könnten, weil sie sich nicht kohärent generalisieren ließen. Eine 
Umlautregel, die Primär- und Sekundärumlaut gleichzeitig 
berücksichtigt, hätte z.B. nach Iverson & Salmons (1996:78) folgende 
Form. 


(3) Einheitliche Regel für Primär- und Sekundärumlaut 
(Iverson & Salmons 1996:78) 


— cons 
V > —back |/_C, | -back 
< —long> < —low> +high 


Dabei miissten die eingeklammerten Teile der Umlautregel wegfallen, 
wenn C, eine Konsonantenverbindung wie etwa /xC/ beinhaltet, denn in 
solchen Fällen fände sich Sekundärumlaut /a/ — /a/ statt des 
Primärumlauts /a/ > /e/. Da dies keine adäquate deskriptive Regel für 
einen einheitlichen i-Umlaut sei, müsse man davon ausgehen, dass es sich 
bei Primär- und Sekundärumlaut nicht um einheitliche Prozesse handle. 
Dieser Vorwurf wirkt allerdings konstruiert. Zum einen zielt er nur auf 
Regeln innerhalb der generativen Phonologie ab, zum anderen sollte es 
eigentlich kaum erwähnenswert sein, dass Lautwandelprozesse ohne 


44 


weiteres durch mehrere generative Regeln abgebildet werden diirfen, die 
in Feeding- und Bleeding-Beziehungen zueinander stehen. Ein passender, 
rein phonologisch begriindeter Vorschlag fiir den i-Umlaut findet sich 
bereits bei Vennemann (1972b:881-883), der zwischen den zwei 
Prozessen „fronting of all back vowels“ und „raising of [æ] and [e]“ 
unterscheidet. Demnach wurden zum einen alle hinteren Vokale vor 
einem hohen vorderen Nicht-Konsonanten (also vor i und j) in der 
folgenden Silbe palatalisiert, solange keine Silbengrenze zwischen den 
Vokal und folgendes i, j trat. Zum anderen galt eine Regel, wonach die 
Vokale [a] und [e] zu [e] gehoben wurden,!? wenn ein i-Laut in der 
nächsten Silbe folgte und kein tiefer Konsonant dazwischen lag. 
Vennemann zeigt, dass unter anderem /rC/ und /IC/ in zahlreichen 
Sprachen senkend auf vorhergehende Vokale wirken.! Durch genau diese 
Konsonanten wurde denn auch im Althochdeutschen die Hebung zu [e] 
unterbunden und vor diesen Konsonantenverbindungen blieb der [a]- 
Laut erhalten, welcher in den ahd. Quellen meist mit (a) wiedergegeben 
wird. Der i-Umlaut betrifft also alle hinteren Vokale gleichermaßen, aber 
[a] und [e] wurden zusätzlich zu [e] gehoben, solange kein senkender 
Konsonant folgte. Es gibt eine einheitliche Umlautregel für alle Vokale 
und eine allgemeine Hebungsregel für die vorderen, nicht-hohen Vokale. 
Der Einwand, die deskriptiven Schwierigkeiten seien unüberwindbar, 
trifft schlichtweg nicht zu. Zudem sollte man sich nicht von einer Theorie 
vorgeben lassen, was möglich ist und was nicht. Im Zweifelsfall muss die 
Theorie verbessert werden, vgl. dazu Teil V, in dem eine 
optimalitätstheoretische Analyse des althochdeutschen i-Umlauts 
vorgeschlagen wird. 


15 [e] ist dabei die Realisationsform von ahd. ë (< germ. e); das Umlaut-[e] 
liegt dann zwischen [e] und geschlossenem [i]. 

16 Die senkende Wirkung der fraglichen Konsonanten weist Vennemann zum 
Beispiel anhand der ahd. Monophthongierung von /ai/ zu /&/ vor /h, r, w/ und 
von /au/ zu /6/ vor Dentalen und germ. /h/ nach. Daneben erklärt er aber auch 
zahlreiche andere Lautwandelphänomene durch den senkenden Einfluss dieser 
Konsonanten. 
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5. Fehlende Umlautreflexe in den modernen 
Nachfolgesprachen 


Voyles (1991:166f.; 1992b:369f.) wendet gegen den strukturalistischen 
Ansatz ein, dass jedes umlautfahige schwache Verb, fiir das ein -j- im 
voralthochdeutschen Stamm angenommen werde, nach der 
Standardtheorie den i-Umlaut aufweisen müsse. Jedoch zeige sich dieser 
Umlaut nicht immer im heutigen Standarddeutsch. Voyles (1991:166; 
1992b:369f.) nennt folgende Beispiele. 


(4) Umlautreflexe im Neuhochdeutschen 
ahd. senden > nhd. senden, 
ahd. kunden > nhd. künden, 
ahd. dursten > nhd. dürsten, 
ahd. lösen > nhd. lösen 


(5) Fehlende Umlautreflexe im Neuhochdeutschen 
ahd. suochen > nhd. suchen, nicht *süchen 
ahd. gilouben > nhd. glauben, nicht *gläuben 
ahd. roufen > nhd. raufen, nicht *räufen 


Alle von Voyles aufgelisteten Wörter hatten in den mitteldeutschen 
Dialekten nachgewiesenermaßen den Umlaut. Im heutigen 
Standarddeutsch finden sich aber auch oberdeutsche Formen, bei denen 
der Umlaut von /u:, ou, uo/ vor einem Labial- oder Velarlaut nicht 
durchgeführt wurde (Fertig 1996:174; eine phonologische Erklärung bei 
Howell & Salmons 1997). Dass manche dieser Wörter im heutigen 
Standarddeutschen den Umlaut aufweisen und andere nicht, ergibt sich 
einfach daraus, dass die neuhochdeutschen Formen aus verschiedenen 
Dialekten übernommen wurden. 

Doch aus den unterschiedlichen Reflexen des Umlauts in den 
Dialekten lässt sich ein anderes Argument für eine Trennung des Umlauts 
in separate phonologische Prozesse konstruieren. In diesem Sinne 
interpretieren zum Beispiel Iverson & Salmons (1996) die Unterschiede 
bei den Umlautreflexen von Primärumlaut und nicht-primärem Umlaut 
im Standarddeutschen und in den Dialekten. Während der Primärumlaut 
a > e in allen Dialekten gleichermaßen nachweisbar sei, gebe es 
Unterschiede in der Ausbreitung der übrigen Umlaute. Dies zeige sich 
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auch bei standarddeutschen Wörtern, die umlautlose Formen neben 
umgelauteten Formen haben. 


(6) Unterschiedliche Umlautreflexe im Deutschen (Iverson & Salmons 
1996:76f.) 


(6a) Varianten im Standarddeutschen: 
südliche Variante ohne Umlaut, nördliche Variante mit 
Umlaut 


nutzen — nützen 
fronen — frönen 
Innsbruck — Osnabriick 
Kramer — Krämer 


(6b) Oberdeutsche Wortformen ohne Sekundärumlaut, 
standarddeutsche Varianten mit Umlaut 


muk — Mücke 
ftuk - Stück 
khuxa — Küche 
dro"ma — trdumen 


(6c) Nord- und mitteldeutsche Dialekte mit Sekundärumlaut, 
standarddeutsche Formen ohne Umlaut 


köpm — kaufen 
höfd — Haupt 
dörp - Dorf 
söügn — suchen 


Diese Befunde sehen die beiden Autoren als Hinweis darauf, dass der 
Primärumlaut in frühalthochdeutscher Zeit stattfand, anschließend i, j 
vom Süden her schwanden und der Sekundärumlaut erst zur Mitte der 
althochdeutschen Sprachperiode einsetzte. Da die i-Laute im Süden schon 
früh abgebaut waren, fänden sich dort weniger nicht-primäre Umlaute. 
Primärumlaut dagegen sei im gesamten deutschen Sprachgebiet so gut 
wie einheitlich durchgeführt worden. Problematisch ist die 
Argumentation vor allem, weil die Chronologie und Geographie des j- 
Schwundes aufgrund seines frühen Auftretens in althochdeutscher Zeit 
nur sehr begrenzt zurückzuverfolgen ist. Ungewöhnlich ist zumindest die 
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Annahme, dass sich ein Lautwandel vom Bairischen aus in fränkische 
Richtung ausgebreitet habe. Warum sollte der j-Schwund eine Ausnahme 
gewesen sein? Ebenso denkbar ist, dass sich lediglich eine bestimmte 
orthographische Konvention durchsetzte. So könnte das Graphem (i) als 
Umlautmarkierung gedient haben, wenn es in der Folgesilbe geschrieben 
wurde. Da im Süden weniger umgelautet wurde, tauchen weniger (i) auf. 
Im Fränkischen dagegen erscheint in der Schrift (i) bei Wörtern, wo es 
etymologisch nicht hingehört, weil (i) in der Folgesilbe nun auch als 
Umlautmarkierung fungiert. Die Schreibung von (i) aufgrund einer rein 
orthographischen Regel könnte unabhängig vom j-Schwund der 
gesprochenen Sprache durchgedrungen sein. Allerdings ist für die 
Behauptung von Iverson & Salmons zentral, dass der Halbvokal j 
tatsächlich mitten in der althochdeutschen Periode vom Süden her 
schwand und gleichzeitig der nicht-primäre Umlautprozess einsetzte. Die 
Quellen geben kaum Hinweise darauf. Stattdessen schwindet ein Großteil 
der i-Schreibungen vor dem Auftauchen der Umlautschreibungen. Daher 
spricht alles dafür, dass das Auftreten der umlautlosen Formen im Süden 
nicht durch die frühzeitige Reduktion der i-Laute bedingt war.” Im 
Gegenteil sprechen die Daten recht eindeutig gegen eine Trennung von 
Primär- und Sekundärumlaut. Denn es folgt aus dem sehr frühen Verlust 
von j — der schon in den Schriften des 9. Jahrhunderts ersichtlich ist, 
aber in der gesprochenen Sprache sicherlich noch früher stattgefunden 
hat — dass der Sekundärumlaut nicht erst im Mittelhochdeutschen 
aufgetreten sein kann. Das sehen auch Iverson & Salmons und datieren 
den nicht-primären Umlaut auf die Mitte der althochdeutschen 
Sprachperiode, statt wie üblich ins Mittelhochdeutsche. Dadurch 
schrumpft die postulierte zeitliche Lücke zwischen Primärumlaut im 8. 
Jahrhundert und Sekundärumlaut zum Anfang des 10. Jahrhunderts auf 
wenig mehr als 100 Jahre. Entsprechend geschwächt wird das 


17 Das Fehlen des Umlauts könnte auch durch die Konsonanten in der 
Silbenkoda verursacht sein: Im Bairischen unterbleibt der Umlaut /o:/ > /g:/ vor 
/n/, im Oberdeutschen der Umlaut des /u/ vor /It, ld, gg, ck, pf, tz, N+C/, langes 
/u/ wird bei nachfolgendem Labial oder /gg/ nicht wumgelautet. 
Umlauthemmende Konsonantenverbindungen lassen sich jedenfalls sicherer den 
umlautlosen südlichen Formen zuordnen als sich der Schwund von /j/ durch die 
Quellen zurückverfolgen lässt. 
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chronologische Argument für die Trennung von Primär- und 
Sekundärumlaut. 

Ein anderes dialektologisches Argument basiert auf dem i-Umlaut im 
Altniederfränkischen, dem Vorgänger des heutigen Niederländischen. 
Von den altniederfränkischen Dokumenten bis zu den modernen 
niederländischen Dialekten hin zeigen sich ausschließlich Reflexe des 
Umlauts von kurzem a zu e. Dieser Umlaut wird, genauso wie im 
Althochdeutschen, durch die Konsonantenverbindung (ht) gehemmt. 
Lediglich im Limburgischen und in einigen verwandten Dialekten des 
Ubergangsgebiets zu den deutschen Dialekten konnte sich der 
Sekundärumlaut ausbreiten. Daraus könnte geschlossen werden, dass der 
Primärumlaut ein einheitlicher, zusammenhängender Prozess im 
Althochdeutschen und Altniederfränkischen gewesen sei, auf den später 
ein nicht-primärer Umlaut vor allem auf deutschem Sprachgebiet folgte, 
der sich nur zum Teil auch in den niederländischen Nachbardialekten 
ausbreitete (so insbesondere Iverson & Salmons 1996:74f.). Bei 
Anwendung der Standardtheorie auf das Altniederfrankische miisse man 
dagegen annehmen, dass auch die nicht-primären Umlaute zunächst 
vorhanden waren, dann aber bis in unsere Zeit wieder verloren gingen 
(Kyes 1967; kritisch Voyles 1991:166f.; Iverson & Salmons 1996:74f.). 
Demnach entwickelten sich auch im Niederländischen vor /i, j/ zunächst 
allophonische Varianten [a:, @(:), yG)] der Phoneme /a:, o(:), u(:)/. Diese 
wurden nicht in der Schrift wiedergegeben und später mit dem Schwund 
der /i, j/ in den Nebensilben wieder zu [a:, o(:), uC)] zurückgebildet. 
Ebenso wie im Althochdeutschen wurde nur der Umlaut des kurzen a, für 
den der lateinische Buchstabe (e) zur Verfügung stand, in der Schrift 
wiedergegeben. Durch den Phonemzusammenfall von Umlauts-/e/ und 
germ. /&/ konnte sich der Umlaut des kurzen /a/ in der weiteren 
Sprachentwicklung halten, während alle übrigen Umlautallophone nicht 
phonemisiert wurden und wieder schwanden. In den niederländisch- 
fränkischen Grenzgebieten dagegen drang infolge des Sprachkontaktes 
auch Sekundärumlaut durch. Den Primärumlaut als einen isolierten 
Prozess anzusehen, der sich auf kurzes /a/ beschränkt haben soll, bleibt 
gegenüber der standardtheoretischen Interpretation des 
mittelniederländischen i-Umlauts unplausibel. 
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6. Primärumlaut und germanische Hebung und Senkung 


Ein typologisches Argument für den Sonderstatus des Primärumlauts 
stützt sich auf Buccini (1992), wonach der Primärumlauta > e vor i j als 
Teil einer germanischen Vokalhöhenharmonie interpretiert werden könne 
(Iverson & Salmons 1996:72-74). Dagegen seien die nicht-primären 
Umlaute Teil einer Vokalfrontierungsharmonie. So, wie im Germanischen 
die hohen Stammvokale i und u durch ein folgendes a zu mittleren 
Vokalen gesenkt würden, während die mittleren Stammvokale e und o 
durch nachfolgende hohe Vokale zu den hohen Vokalen i und u gehoben 
würden, sei auch die Assimilation von a an folgende i, j ein Teil dieser 
Vokalhöhenharmonie. Der Primärumlaut a > e sei also im Wesentlichen 
eine Hebung und nur nachrangig auch eine Palatalisierung. Damit bilde 
der Primärumlaut ein natürliches Bindeglied für den Übergang von der 
frühen Höhenharmonie zur späteren Frontierungsharmonie, die sich dann 
durch den nicht-primären Umlaut mit reiner Palatalisierung ohne 
Hebung verwirkliche. Wie Buccini (1992:44-94) durch die Untersuchung 
zahlreicher germanischer und anderer Sprachen nachgewiesen habe, sei 
das Vorhandensein von Höhenharmonie eine Voraussetzung für die 
Entstehung von Frontierungsharmonie. Primärumlaut vollende somit die 
germanische Höhenharmonie und bilde gleichzeitig den Übergang von 
der Höhenharmonie zur Frontierungsharmonie. Nicht-primärer Umlaut 
aber sei ausschließlich Frontierungsharmonie. 

Gegen den theoretischen Anschluss des Primärumlauts an die 
germanischen Lautwandelprozesse lassen sich jedoch eine Reihe guter 
Gründe anführen. Im Sinne der vokalharmonischen Angleichungen, die 
vom Germanischen zum Althochdeutschen hin stattfanden, bilden i, u die 
Klasse der hohen Vokale und a, e, o die Klasse der tiefen Vokale, weil 
minderbetonte a, e, o in der Folgesilbe senkend wirkten, i u dagegen 
hebend. Bei vokalharmonischen Höhenassimilationen wechselt der 
assimilierte Vokal in die Klasse des nachfolgenden Vokals: aus einem 
hohen wird ein tiefer Vokal, aus einem tiefen wird ein hoher Vokal, vgl. 


(7). 
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(7) Hohe und tiefe Vokalklasse der germ./ahd. Vokalharmonie 


„hoch“ 
o „tief“ 


(8) Vokalhohenharmonie 1m Germanıschen 


germ.i > ahd.e vora, e,o 
germ.u > ahd.o vora, e,o 
germ. eu > ahd. eo vor a, e, o 
ahd. iu vori, u 
germ.e >ahd.i vori, u 


Die Beispiele aus Iverson & Salmons (1996:73) sind mit Hilfe der beiden 
Klassen „hoch“ und „tief“ erschöpfend zu beschreiben, vgl. (9). 


(9) Hebung und Senkung im Germanischen (Iverson & Salmons 


1996:73) 

ahd. nest < protogerm. *nista Beispiele für tiefe a, o, 
ahd. wer < idg. *wiros die auf hohe i, u 

ahd. bodam < protogerm. *bubma senkend wirkten 

ahd. filu < idg. *pelu- Beispiele für hohe i, u, 
ahd. fihu < idg. *peku- die auf tiefes e 


ahd. mitti < idg. *medh-yo (lat. medius) hebend wirkten 


Primärumlaut dagegen wandelt tiefes a zu tiefem e, wenn ein hoher 
Vokal i folgt. Zwei Gründe sprechen demnach dagegen, den Umlaut von a 
zu e als Höhenharmonie aufzufassen. Zum einen bleibt tiefes a ein tiefer 
Vokal im Sinne der germanischen Vokalhöhenharmonie (nämlich e), hat 
also die Klasse nicht gewechselt. Zum anderen hat zwar hohes i Hebung 
bewirkt, hohes u aber nicht, obwohl diese beiden Vokale bei allen 
anderen Höhenassimilationen auf dem Weg vom Germanischen zum 
Althochdeutschen gemeinsam wirken. Iverson & Salmons begegnen 
ersterem Problem durch die implizite Einführung einer Klasse mittlerer 
Vokale e, o. Im Zusammenhang mit a-Umlaut und e-Wechsel schreiben 
sie: „A following /a/ lowers an etymological high vowel to mid, while a 
following high vowel raises an etymological mid vowel to high“ (Iverson 
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& Salmons 1996:72). Sicherlich sind [e] und [o] artikulatorisch gesehen 
mittlere Vokale, jedoch wird bei den vokalharmonischen Assimilationen 
im Germanischen der Unterschied zwischen mittleren und tiefen Vokalen 
nicht zur Beschreibung benötigt. In diesem Sinne ist die Klasse „mid 
vowel“ ad hoc zur Subsumierung des Primärumlauts eingeführt worden. 
Gegen eine mittlere Klasse spricht jedoch, dass sie beim Übergang vom 
Germanischen zum Althochdeutschen sonst keine Rolle gespielt hat. Aus 
mittlerem e, o wurde nie tiefes a durch nachfolgendes tiefes a; aus tiefem 
a nie mittleres e, o durch nachfolgendes hohes u. Sinnvoller wäre es, 
zwischen einem hohen Umlaut-e vor hohen Vokalen und einem tiefen 
germ. ë vor tiefen Vokalen zu differenzieren, worauf ja auch die 
Reimbildung bei einigen mittelhochdeutschen Dichtern hinweist (Braune 
& Reiffenstein 2004: 828, Anm. 1). Im Germanischen sind also nur die 
Klasse der hohen Vokale (i, u und e) und die Klasse der tiefen Vokale (a, € 
und o) zu unterscheiden. 

Der größere Hinderungsgrund, den Primärumlaut als Höhenharmonie 
aufzufassen, ist jedoch, dass hohes u beim Primärumlaut keine hebende 
Wirkung hatte. Dadurch wird es unplausibel, den Primärumlaut im 
Wesentlichen als Höhenharmonie zu verstehen. Der Wandel von a zu e ist 
gleichermaßen Frontierung und Hebung. 

Um zu begründen, dass der Primärumlaut ein Teil der germanischen 
Vokalhöhenharmonie sei, mutmaßen Iverson & Salmons (1996:73) 
weiter, dass Vokalhöhenharmonie und Primärumlaut gleichzeitig 
aufgetreten seien („height harmony was synchronically concurrent with 
primary umlaut“). Jedoch können die verschiedenen Lautwandel nicht 
eine längere Zeit parallel im Germanischen oder Althochdeutschen 
gewirkt haben, sonst müssten sich vielfach Reflexe von Primärumlaut 
und gleichzeitiger oder zumindest kurz darauf folgender 
Vokalharmonisierung finden lassen, vgl. (10). 
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(10) Wortformen mit Primärumlaut und Vokalharmonie sind nicht belegt 


Älteste Form Primärumlaut Höhenharmonie 
gasti > gesti > *gisti 

lambir > lembir > *limbir 

faris > feris > *firis 

fasti > festi > *fisti 


Ungeklärt bleibt außerdem, warum das kurze, tiefe a bei der 
Höhenassimilation ausgerechnet als letztes angeglichen worden sein 
sollte, nachdem e und i schon im Germanischen an die Vokale der 
Folgesilbe assimiliert worden waren. Dieses Problem wiegt umso 
schwerer, als laut Howell & Salmons (1997) die Vokale mit der größeren 
Distanz im Vokalraum als erstes von vokalharmonischen Prozessen 
betroffen sind. 

Zusammenfassend bleibt festzustellen, dass der Umlaut von a zu e 
nicht nur eine Hebung, sondern auch eine Palatalisierung darstellt. Wenn 
dabei die Hebung nicht als primär angesehen werden kann - mit obiger 
Argumentation und entgegen Buccinis (1992) Behauptung -, dann ergibt 
sich der theoretische Anschluss des Primärumlauts an den nicht-primären 
Umlaut als ungezwungenste Erklärung der Phänomene. 


7. Koartikulation als phonetische Basis des Umlauts 


Ein interessanter Ansatz, zusätzliche empirische Daten in die 
Umlautforschung einzubringen, besteht darin, die Erkenntnisse der 
Phonetik zur Koartikulation zu berücksichtigen. Koartikulation meint 
dabei die Variation einzelner Laute aufgrund des Einflusses angrenzender 
oder nahegelegener Laute. Sie ist ein automatischer Prozess, der sich in 
gesprochener Rede ständig vollzieht. Es ist davon auszugehen, dass 
koartikulatorische Prozesse eine der phonetischen Grundlagen für 


diachrone Lautwandelprozesse darstellen.” Aus koartikulatorischen 


18 Neben der artikulatorischen Phonetik (sprecherseitige Perspektive) spielt 
sicherlich auch die auditive Phonetik (hörerseitige Perspektive) eine sehr 
gewichtige Rolle, vgl. Teil III, S. 77ff. zur Kompensation der Koartikulation durch 
die Hörer. 
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Mustern können sich phonologisch fassbare Assimilationsregeln 
entwickeln. Die Vermutung liegt nahe, dass auch der i-Umlaut auf 
Koartikulation zurückgeht. Ein erster Vorschlag in diese Richtung stammt 
von Iverson & Salmons (1999). 


„It seems likely that i-umlaut sprang from such coarticulatory patterns, 
too, which most probably were present from the very early on at a nascent 
level, presumably below the threshold of perception. The phonetics of 
vowel-to-vowel coarticulation, in short, prepared a rich seedbed for 
umlaut.“ (Iverson & Salmons 1999:215) 


Während diese Idee an sich durchaus plausibel ist, kann man die 
Schlussfolgerungen, die Iverson & Salmons aus den phonetischen 
Forschungsergebnissen ziehen, durchaus bezweifeln. So formulieren die 
beiden Autoren folgende Begründung für die Trennung von Primär- und 
Sekundärumlaut. 


„[...] there is also a basic principle at work [...] that syllable sequences 
with less articulatorily similiar vowels assimilate preferentially over 
sequences with more similiar ones. Thus, with regard to i-Umlaut, /a/ 
mutates first and most consistently (the primary umlaut phenomenon), 
while /o/ mutates later and less pervasively than /a/ but more than /u/, 
which umlauts last and least consistently.“ (Iverson & Salmons 1999:213) 


Das hier genannte Grundprinzip sehen die Autoren experimentell 
bestatigt durch eine Untersuchung von Butcher & Weiher (1976), in der 
Koartikulation von einem Vokal zum anderen bei deutschen Sprechern 
der Gegenwart untersucht wurde. Das Ergebnis sei eine 
Koartikulationshierarchie der Vokale, bei der [i] den größten 
koartikulatorischen Einfluss ausübe und [a] den niedrigsten. Leider 
erklären Iverson & Salmons nicht, wie sie von den 
gegenwartssprachlichen Koartikulationsmustern auf eine diachrone Regel 
rückschließen können, die systematisch die hinteren Vokale palatalisiert. 
Sie behaupten ohne weitere Argumentation, dass aus synchroner 
Koartikulation Unterschiede für die Chronologie der Umlaute folgen 
würden: Weil [a] am stärksten der Koartikulation ausgesetzt ist, wird es 
auch früher umgelautet; weil [o] weniger stark der Koartikulation 
ausgesetzt ist, wird es etwas später umgelautet; und weil [u] am 
schwächsten der Koartikulation ausgesetzt ist, wird es zuletzt umgelautet. 
Dass dieser Schluss voreilig ist, zeigt folgende alternative Überlegung. 
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Gesetzt, es gab eine Koartikulationshierarchie der Vokale im 
Althochdeutschen ähnlich wie bei den neuhochdeutschen Sprechern der 
Gegenwart, so dass [a] am stärksten an [i] angeglichen wurde, [o] schon 
weniger, [u] aber die schwächste Koartikulation aufwies. Diese 
Koartikulation dürfte dann schon seit frühester Zeit ohne weiteren 
Einfluss auf das Phonemsystem bestanden haben. Es handelt sich also um 
allophonische Variation. Diese allophonische Variation wird zu einem 
bestimmten Zeitpunkt phonemisiert und damit konserviert. Je größer die 
Koartikulation dabei ausfällt, desto eher wird sie wahrgenommen und 
desto eher wird sie auch phonemisiert. Weil die Koartikulation bei 
kurzem [a] in allen Dialekten am stärksten war, kann auch überall 
einheitlich der Umlaut von a zu e festgestellt werden; weil [o] und [u] 
weniger Koartikulation mit [i] zeigen, finden sich auch in weniger Fällen 
die Umlaute von o zu 6 und von u zu ü. Die Koartikulationsmuster der 
deutschen Gegenwartssprache stützen also eher die Standardtheorie. 

Zwei wichtige Probleme bleiben aber offen: (1.) Wie konnte 
Koartikulation in einer Sprachperiode, in der die Nebensilben mit den 
umlautauslösenden i-Lauten abgeschwächt wurden, als also auch die 
Koartikulation schwächer hätte werden müssen, zu einer grammatischen 
Assimilationsregel führen. Eine Antwort auf diese Frage wird im 
folgenden Abschnitt entwickelt. (2.) Welche Aspekte der Koartikulation 
lassen sich auf welche Weise sinnvoll in die Umlautdiskussion 
einbringen. Dies wird in Teil III Umlaut und seine phonetischen Grundlagen 
ausfiihrlich besprochen. 


8. Phonemisierung und morphologische Aspekte des 
Umlauts 


Die Masse der Forschungsliteratur zum Umlaut im Althochdeutschen geht 
von phonologischen Umlautbedingungen aus. Zugrundegelegt wird meist 
ein strukturalistisch gedachtes Phoneminventar, das aus den Oberflächen- 
kontrasten rekonstruiert wird (Penzl 1949:229ff., 1969:55f., 1971a:122f., 
1972:83f., 1983:133; Moulton 1961/1962:24f.; Antonsen 1964:188ff.; 
Dal 1967a, 1967b; Kyes 1967:672; Russ 1977:218; Sonderegger 
1979:304). Neuere phonologische Ansätze finden sich bei Wiese (1987; 
1989; 1996b:187f.) und Lodge (1989), die zur Erklärung des 
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althochdeutschen Umlauts ein Autosegment [+vorn] bzw. [front] 
ansetzen, das in frühalthochdeutscher Zeit Teil der Tiefenstruktur des 
Vordervokals sei, ab dem Spätalthochdeutschen zu einem ungebundenen 
Autosegment werde und dies auch bis in die heutige Zeit bleibe. Im 
Rahmen der autosegmentalen Phonologie arbeiten auch Iverson & 
Salmons (1996; 1999) und schlagen vor, dass das Merkmal [coronal] sich 
in zwei Schritten ausbreitete, zunächst als primärer Umlaut des kurzen a 
im Althochdeutschen und später durch Einführung einer 
Regelvereinfachung als nicht-primärer Umlaut im Mittelhochdeutschen. 
Nur wenige Autoren halten den Umlaut bereits im Althochdeutschen für 
morphologisch bedingt (Robinson 1975, 1980; Voyles 1976, 1977, 1991, 
1992a, 1992b, 1994; Wurzel 1980, 1981, 1989; Janda 1998). Den 
meisten gilt der Umlaut erst ab dem Mittelhochdeutschen als 
morphologisiert oder lexikalisiert. Allerdings gibt es durchaus generative 
Analysen, in denen der Umlaut auch im Neuhochdeutschen noch 
phonologisch interpretiert wird (Strauss 1976; Wiese 1996a, 1996b). 
Dass der Umlaut schon im Frühalthochdeutschen nicht mehr rein 
phonologisch bedingt sein kann, zeigt sich daran, dass (1.) unbetonte i 
und j nicht immer den Umlaut vorangehender velarer Stammvokale 
bewirken und dass (2.) die meisten Umlaute im Althochdeutschen auch 
dann erhalten sind, wenn die ursprünglichen Umlautauslöser i, j bereits 
geschwunden sind. So fehlt der Umlaut im Optativ Präteritum der 
rückumlautenden Verben trotz des Flexionssuffixes -i, zum Beispiel ahd. 
branti ‘brennen (Opt. Prät.)’; der Primärumlaut wird bei den schwachen 
Maskulina und Feminina der n-Deklination häufiger vor der 
Flexionsendung -in zurückgenommen, etwa in ahd. hanin zu ahd. henin 
‘Henne’ (der analoge Ausgleich basiert auf dem umlautlosen Maskulinum 
hano ‘Hahn’); der Primärumlaut fehlt gelegentlich bei den starken 
Adjektiven und in der i-Deklination trotz des Suffixes -iu (alliu ‘alle’ 
neben elliu, gastiu ‘Gast (Instr.Sg.)’ neben gestiu); der sehr früh belegte, 
bairische Ortsname Mammendorf zeigt statt des zu erwartenden 
Primärumlauts lediglich Sekundärumlaut sowohl in den Frühbelegen (8. 
und 9. Jh.: Mammindorf) als auch in den heutigen mundartlichen 
Reflexen (Schwarz 1954)'?. Andererseits steht der Umlaut auch ohne 


19 Gütter (2003) hält auch die Ortsnamen Ampfing und Pabing für vergleichbar, 
jedoch haben die Ortsnamen auf -inga (Erstbelege aus dem 8. Jh.: Amfinga, 
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nachfolgendes i oder j bei den jan-Verben, den femininen jon-Stämmen 
sowie den Maskulina der n-Deklination. Anders als in neuerer Zeit öfter 
behauptet (Iverson, Davis & Salmons 1994; Iverson & Salmons 1996, 
1999, 2000, 2003), war die Vokalpalatalisierung im Althochdeutschen 
eindeutig kein aktiver phonologischer Prozess mehr. Zuletzt hat Janda 
(1998:202f.) daraus geschlossen, dass der Umlaut bereits mit Einsetzen 
der Verschriftlichung des Althochdeutschen morphologischer und nicht 
mehr phonologischer Natur gewesen sei. Nur in voralthochdeutscher Zeit 
gab es einen phonologischen Umlaut (so bereits Antonsen 1964). 

Die nicht-phonologischen Aspekte des Umlauts im frühesten 
Althochdeutsch sind in der Forschung bisher tatsächlich eher zu kurz 
gekommen. Dabei legt auch ein Blick auf die Ausbreitung des 
Primärumlauts von a in den Denkmälern eine morphologische oder 
lexikalische Interpretation nahe. Das Umlaut-e muss sich in der 
Orthographie des 8. Jahrhunderts erst durchsetzen und breitet sich bis 
zum 9. Jahrhundert aus. Mit minimalem zeitlichen Vorlauf war das 
inlautende j der Flexionssilben geschwunden, was anhand der ältesten 
Quellen noch nachzuvollziehen ist. Da mit dem j-Schwund die 
Umlautallophone erstmals bedeutungsunterscheidende Funktion 
übernehmen — traditionell gesagt: sie werden phonemisiert — setzt kurz 
darauf tatsächlich die Markierung des Umlauts a > e in der Schrift ein. 
Besonders zu beachten ist hier nun die Reihenfolge: erst schwinden die j, 
dann erst tauchen Umlautmarkierungen auf. Da mit dem j-Schwund nicht 
auch die Umlaute zurückgenommen werden, müssen die Wortformen mit 
Umlautallophonen bereits zuvor lexikalisiert worden sein, so dass das 
Auftreten des Umlauts unabhängig von der phonologischen Umgebung 
wurde. Dies widerlegt die Annahme, Allophone müssten zunächst 
phonemisiert werden, bevor sie lexikalisiert werden könnten. Gerade 
umgekehrt gilt: Nur solche gebundenen Allophone, die im Lexikon 
gespeichert sind, können auch nach dem Wegfall der Allophonie-Auslöser 
erhalten bleiben. Gebundene Allophone, die nicht lexikalisiert sind, 
müssen gemeinsam mit ihren Allophonie-Auslösern schwinden. 

Gleichzeitig scheinen morphologische Beschränkungen die Verteilung 
der Umlaute zu beeinflussen. Ein gutes Beispiel dafür ist das bereits 


Papinga) eine andere prosodische Struktur, indem das i einen Nebenton trägt und 
darum nur Sekundärumlaut, nicht etwa Primärumlaut zu erwarten ist. 
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erwähnte Flexionssuffix -i des Optativ Präteritum bei rückumlautenden 
Verben, das nie Umlaut auslöst, vgl. (11). 


(11) Optativ Präteritum im Althochdeutschen 
Formen bei Otfrid (s. Wilmanns 1897:252) 


ahd. zalti, dualti, thakti, githagti, wakti, harti, branti, nanti, wanti, 
santi, kanti, wangti, giangti, hangti, skankti, scafti, firthuasbti, quatti 


Da es keine Anzeichen dafür gibt, dass der Umlaut lediglich nachträglich 
zurückgenommen wurde, wie dies zum Bespiel bei den schwachen 
Maskulina und Feminina der n-Deklination der Fall war (z.B. wird ahd. 
henin schon früh im Althochdeutschen zu hanin unter dem Einfluss des 
Basismorphems han-), ist davon auszugehen, dass dem Optativ 
Präteritum der rückumlautenden Verben im Althochdeutschen zwar stets 
ein i-haltiges Suffix, aber niemals Umlaut eigen war. Da es sich hierbei 
nun um eine sehr klar umgrenzte morphologische Klasse handelt, könnte 
eine morphologische Beschränkung die Ausbreitung des allophonischen 
Umlauts bereits im Voralthochdeutschen unterbunden haben (so die 
Intention bei Janda 1998). Es ist aber nicht sehr plausibel, dass 
ausgerechnet für eine periphere morphologische Klasse eine aktive 
Umlautbeschränkung gegolten haben sollte. Zudem müsste angenommen 
werden, dass sich morphologische Regeln auch auf Allophone beziehen 
können, was nicht unumstritten ist. Deshalb soll hier eine komplexere 
Lösung vorgeschlagen werden, die im Gegenzug zu ihrer Komplexität 
einen höheren Erklärungswert hat. 

Der Lösungsvorschlag basiert zum einen auf der Beobachtung, dass 
unregelmäßige Formbildungen in morphologischen Klassen mit niedriger 
Gebrauchsfrequenz zurückgenommen werden. Zum anderen liegt die 
Annahme zugrunde, dass der phonetische i-Umlaut im Althochdeutschen 
immer nur allophonisch wirkt und keinen phonemischen Wechsel des 
Stammvokals verursachen kann. Nach der Phonemisierung der 
Umlautallophone kann die Palatalisierung hinterer Vokale nicht mehr 
durch nachfolgende i-Laute ausgelöst werden. Entscheidend ist der 
Übergang von der älteren Sprechergeneration, für die die Umlautvokale 
als Allophone zu gelten haben, zur jüngeren Generation, für die die 
Umlautvokale bereits Phoneme sind. Sobald ein Sprecher einen 
phonemischen Unterschied zwischen den Lauten [u] und [y], [o] und 
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[ø], [a] und [a] bzw. [e] machte, konnte es für ihn im Hinblick auf 
diesen Vokalwechsel keine allophonische Variation mehr geben, weil 
diese Alternanzen Phonemgrenzen überschritten. Zugleich wurde der 
Optativ Präteritum der rückumlautenden Verben zu selten gebraucht, als 
dass die jüngere Sprechergeneration von der älteren Generation die 
allophonische Umlautalternanz bei den Optativ-Präteritum-Formen als 
lexikalisches oder morphologisches Wissen hätten erlernen können. Beim 
Paradigma des rückumlautenden Verbs zellen etwa wurde der 
Präsensstamm als zel- erlernt, der Präteritumstamm als zal-. Die 
jüngeren Sprecher vereinheitlichten die Stammalternanz zwischen den 
präsentischen und den präteritalen Formen, indem sie die umlautlose 
Form des Stammes aus den indikativischen Präterita auch für die 
optativischen Präterita verwendeten, wie die Übersicht unter (12) zeigt. 
Weil der Umlaut immer nur allophonische Varianten hervorbringt, kann 
er bei der jüngeren Sprechergeneration, für die die Umlautvokale bereits 
phonemisiert sind, keine Palatalisierung des /a/ mehr bewirken. Da das 
-i in der Optativflexion erhalten bleibt, müsste der i-Umlaut andernfalls 
auch später noch den Umlaut des Stammvokals bewirken, was er aber 
nachweislich nicht tat. 


(12) Rücknahme der Umlautalternanz im Optativ Präteritum der 
rückumlautenden Verben am Beispiel zellen — zalta 


ältere Sprechergeneration, | jüngere Sprechergeneration, 
allophonischer Umlaut Umlautvokale sind 
lexikalisiert 
a) Präs. Präsensstamm zel()-: 
Ind. zellu, -is, -it, -emes, -et, -ent 
b) Präs. Präsensstamm zel(1)-: 
Opt. zelle, -est, -e, -€m, -ét, -en 
c) Prät. Präteritumstamm zal-: 
Ind. zalta, -tös, -ta, -tum, -tut, -tun 
d) Prät. Präteritumstamm zal- Präteritumstamm zal- 
Opt. | mit allophonischem Umlaut: | kein allophonischer Umlaut: 
*z[e]lt, -tis, -ti, -tim, -tit, -tin | zl[allti, -tis, -ti, -tim, -tit, -tin 
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Die palatalisierende Wirkung der i-Laute auf hintere Vokale endet 
demnach zusammen mit der Umlautphonemisierung, was auch durch 
spätere Neubildungen auf -i ohne Umlaut (z.B. das Adjektiv ahd. tannin 
‘aus Tannenholz’) und die sehr frühe Rücknahme einiger Umlaute vor i 
(ahd. hanin ‘Henne’ < frühahd. henin) bewiesen wird. Es scheint lediglich 
so, als sei das Fehlen des Umlauts im Optativ Präteritum der 
rückumlautenden Verben morphologisch motiviert, die tatsächliche 
Erklärung ist in der geringen Gebrauchsfrequenz der betroffenen 
Wortformen und der Aufhebung der phonologischen Umlautregel zu 
finden. 

Auf diese Weise beginnt die Grammatikalisierung des Umlauts bereits 
mit der Lexikalisierung der Umlaute. Dass systematische Ausnahmen 
beim Umlaut in einer bestimmten morphologischen Kategorie, etwa 
fehlender Umlaut im Optativ Präteritum der Rückumlautverben, diese 
morphologische Kategorie markieren können, ist nicht auf aktive 
morphologische Beschränkungen zurückzuführen, sondern das 
unbeabsichtigte Ergebnis der niedrigen Gebrauchsfrequenz einer 
morphologischen Kategorie und des daraus resultierenden Nicht- 
Erlernens der ursprünglichen Stammalternanz. Die Umlautregel enthielt 
nicht von Anfang an morphosyntaktische Informationen, die immer 
weiter angereichert wurden (entgegen Voyles 1991:170£.). Auch die 
Annahme von Penzl (1949:227£.) und Robinson (1980:455-458), nach 
denen der Umlaut im Optativ Präteritum der rückumlautenden Verben 
nach der Umlautphonemisierung zunächst vorhanden gewesen und 
anschließend durch analogischen Ausgleich zurückgenommen worden 
sei, ist nach der hier vorgestellten Erklärung unnötig (entgegen Iverson & 
Salmons 1996:80, die Penzls Analogie-Idee bei den rückumlautenden 
Verben für passend halten). 


2 Genauer gesagt schlägt Voyles zu diesem Problem vor, dass eine doppelte 
Morphemgrenze für das Ausbleiben des Umlauts verantwortlich sei, indem er ahd. 
zalti zergliedern in zal+ t+i mit zwei Morphemgrenzen (im Gegensatz zu ahd. gesti 
= gest+i mit einer Morphemgrenze). Jedoch bleibt die umlauthemmende 
Wirkung einer doppelten Morphemgrenze auf die rückumlautenden Verben 
beschränkt und zeitigt außerhalb dieser morphologischen Kategorie keine 
umlauthemmende Wirkung mehr, z.B. nicht in ahd. fer+t+i ‘Reise (Gen./Dat. 
Sg.)’ zu fahr +t. 
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Um einen möglichen Einwand zu entkräften, müssen noch die 
umgelauteten Nebenformen des Optativ Präteritum erklärt werden. So 
sind besonders im Oberdeutschen bei den rückumlautenden Verben auf tt 
und Il präteritale Nebenformen mit i belegt, zum Beispiel ahd. sentita, 
zelita neben santa, zalta (Braune & Reiffenstein 2004: 8362, Anm. 3). 
Dementsprechend finden sich die umgelauteten Nebenformen sentiti und 
zeliti im Optativ Präteritum. Man könnte behaupten, dass hier das i der 
Mittelsilbe eben doch Umlaut auslöse. Richtig ist jedoch, dass in den 
Dialekten, die das i an dieser Stelle behalten, die Präteritumstämme 
anders lexikalisiert wurden, nämlich in der umgelauteten Form zeli- 
sowohl im Indikativ als auch im Optativ. Da der Präteritumstamm bereits 
mit Umlaut erlernt wurde, musste und konnte keine Umlautregel mehr 
darauf angewandt werden. 


(13) Keine Rücknahme der Umlautalternanz im Optativ Präteritum der 
rückumlautenden Verben bei zellen — zelita 


ältere Sprechergeneration, | jüngere Sprechergeneration, 
allophonischer Umlaut Umlaut nicht mehr aktiv 
a) Präs. Präsensstamm zel()-: 
Ind. zellu, -is, -it, -emes, -et, -ent 
b) Präs. Präsensstamm zel()-: 
Opt. zelle, -est, -e, -€m, -ét, -en 
c) Prät. Präteritumstamm zali- Präteritumstamm zeli- 
Ind. | mit allophonischem Umlaut: | mit lexikalisiertem Umlaut: 
zelita, -tös, -ta, -tum, -tut, -tun | zelita, -tös, -ta, -tum, -tut, -tun 
d) Prät. Präteritumstamm zali- Präteritumstamm zeli- 
Opt. | mit allophonischem Umlaut: | mit lexikalisiertem Umlaut: 
zeliti, -tis, -iti, -tim, -tit, -itin zeliti, -tis, -ti, -tim, -tit, -tin 


Schließlich ist noch auf einen Vorteil der hier gewählten Erklärung 
morphologischer Ausnahmen hinzuweisen. Wiirde man der Morphologie 
eine aktive Rolle bei der Ausbreitung des Umlauts zugestehen und 
morpho-syntaktische Regeln formulieren, so müssten 
Umlautregeln aufgestellt werden, nämlich mindestens 
morphologischer Kategorie, in der die Umlautalternanzen ausgeglichen 
werden. Ein extremes Beispiel ist Voyles (1991:171-183), der fünfzehn 


zahlreiche 


eine pro 
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phonologisch-morphosyntaktische Umgebungen mit eigener Umlautregel 
fiir Isidor, Otfrid und Notker auflistet und dabei feststellt, dass die Anzahl 
der morpho-syntaktischen Regeln zum Mittelhochdeutschen hin immer 
weiter zunimmt. In Wirklichkeit handelt es sich jedoch um eine 
Vereinfachung des morphologischen Systems. Unregelmäßigkeiten 
werden systematisch abgebaut, Sonderregeln für spezielle Flexionsklassen 
entfallen. Dem wird im hier vorgeschlagenen Erklärungsmodus Rechnung 
getragen, indem die Morphologie als auf den Lautwandel passiv 
reagierend aufgefasst wird. Nur in den durch hohe Gebrauchsfrequenz 
hervorgehobenen morphologischen Klassen können sich Sonderregeln 
halten. In niederfrequenten Klassen entfallen sie, weil der Aufwand für 
ihr Erlernen zu hoch ist. 
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Teil III Umlaut und seine phonetischen 
Grundlagen 


1. Aufbau von Teil III 


Teil II Umlaut und seine phonetischen Grundlagen handelt im Abschnitt 
Koartikulation zunächst von den Anfängen der Lautphysiologie und der 
Koartikulationsforschung. Der Abschnitt ist einerseits 
wissenschaftshistorisch orientiert und hat andererseits einen eher 
allgemeinen, einführenden Charakter. 

Im Abschnitt Intervokalische Koartikulation wird Koartikulation 
zwischen Vokalen behandelt, die für die Erklärung des Umlauts im 
Althochdeutschen besonders relevant ist. Der Übergang zwischen zwei 
betonten Vokalen entspricht demnach einer diphthongischen 
Artikulationsgeste, auf die konsonantische Artikulationsgesten und 
unbetonte Vokale aufgesetzt sind (Ohman 1966). Intervokalische 
Koartikulation ist ein automatischer Prozess, zugleich ist sie stark 
sprecherabhängig (vor allem von der Muttersprache und vom Dialekt des 
Sprechers). 

Die hörerseitige Perspektive wird im Abschnitt Kompensation der 
Koartikulation behandelt. In der Regel werden koartikulatorische 
Assimilationen von den Hörern kompensiert, d.h. aus dem Sprachschall 
wieder herausgerechnet. Verschiedene Studien zur 
Koartikulationskompensation und der Einfluss der Muttersprache und der 
Lexik werden hier besprochen. Aus den phonetischen Untersuchungen 
ergibt sich, dass die Sprecher und Hörer des Althochdeutschen mit hoher 
Wahrscheinlichkeit den allophonischen Umlaut in einer Lautfolge wie 
[hy:ti] kompensierten und die umgelautete Form automatisch auf die 
phonemische Form /hu:ti/ bezogen. 

Vor dem Hintergrund der phonetischen Untersuchungsergebnisse 
wird im Abschnitt Phonemisierung als Aussetzen der 
Koartikulationskompensation die Entstehung der neuen Umlautphoneme 
im Vokalinventar des Althochdeutschen besprochen. Phonemisierung 
bedeutet demnach, dass die Kompensation der Koartikulation bei einer 
späteren Sprechergeneration aussetzt und die Umlautvokale beim 
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Spracherwerb unmittelbar mit den erlernten Wortformen lexikalisiert 
werden. 


2. Koartikulation 


„Koartikulation“ bezeichnet als ein zentraler Begriff der Phonetik die 
Variation einzelner lautlicher Segmente in gesprochener Rede aufgrund 
des Einflusses angrenzender oder nahegelegener lautlicher Segmente. So 
werden phonologische Einheiten in verschiedenen lautlichen 
Umgebungen nicht jeweils identisch realisiert, sondern ihre Realisation 
wird benachbarten Lauten manchmal mehr, manchmal weniger 
angepasst. Im Deutschen wird etwa ein /k/ vor einem folgenden 
Vorderzungenvokal weiter vorn am Palatum gebildet (z.B. [k] in [ki:lo] 
Kiele, [ky:lo] Kühle oder [ke:lo] Kehle), vor einem folgenden 
Hinterzungenvokal weiter hinten am Palatum ([ku:lo] Kuhle, [ko:la] 
Kohle, [ka:la] kahle). Zudem wird die Lippenstellung zum Zeitpunkt der 
Realisierung des /k/-Lautes deutlich vom Folgevokal beeinflusst, indem 
die Lippen bereits bei der Realisierung des /k/ gerundet werden 
([k"u:lo], [K"y:lo], [k“o:lo]). In geringerem Maße beeinflusst der Vokal 
auch die Realisation des nachfolgenden /1/-Lautes. Nach dem 
Vorderzungenvokal /i:/ berührt die Zungenspitze während der [1]- 
Artikulation das Palatum weiter vorm ([il]), nach dem 
Hinterzungenvokal /u:/ weiter hinten ([u:l]). Doch auch umgekehrt 
hängt die Artikulation des /u:/ oder /i:/ in der ersten Silbe vom 
nachfolgenden Vokal ab, z.B. erscheint die Stellung des Zungenrückens 
während der Artikulation des /u:/ in /kuli/ im Vergleich zur 
Artikulation des /u:/ in /ku:la/ nach vorn und oben verschoben, da die 
nachfolgende Silbe mit hohem Vorderzungenvokal /i/ statt zentralem 
Vokal /ə/ gebildet ist. Koartikulationsrelationen bestehen also zwischen 
mehreren Lauten gleichzeitig. Der Laut /u:/ in /ku:la/ steht in einer 
Koartikulationsbeziehung mit den drei anderen Lauten /k/, /1/ und /2/. 
Sofern sich diese Koartikulationsphänomene mit den Sinnesorganen 
bewusst wahrnehmen lassen, werden sie in der Phonologie traditionell 
unter dem Begriff der allophonischen Variation behandelt. In einer 
Vielzahl der Fälle sind die Veränderungen, denen ein Segment unterliegt, 
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jedoch nur mittels technischer Messinstrumente im akustischen Signal 
oder im Ablauf der Sprachproduktion nachweisbar. 

Der Begriff Koartikulation wurde erstmals von Menzerath & De 
Lacerda (1933) in ihrem Buch Koartikulation, Lautabgrenzung und 
Steuerung verwendet. Zwar war schon lange vorher bekannt, dass Laute 
sich gegenseitig beeinflussen und je nach lautlicher Umgebung erheblich 
variieren können, jedoch gelang es erst mit Hilfe der experimentellen 
Phonetik nachzuweisen, dass sich der Schallstrom der Rede nicht in 
separate Teilstücke aufteilen lässt. Zuvor setzten artikulatorische 
Untersuchungen damit an, zu jedem Buchstaben (oder zu 
Buchstabenkombinationen) die entsprechenden Einzellaute 
artikulatorisch zu beschreiben. Auch die spätere Entwicklung der 
Lautschriften basiert auf der Idee, den Lautstrom in einzelne Abschnitte 
zu segmentieren: Jedes Lautschriftsymbol soll (auch heute noch) einem 
Lautsegment entsprechen. Die so beschriebenen Lautsegmente werden 
dann als relativ autonome Glieder einer Lautfolge aufgefasst. 

Die Anfänge lautphysiologischer Beobachtungen sind im Gehörlosen- 
unterricht zu finden. Bereits im 16. Jahrhundert soll der spanische 
Benediktinermönch Pietro Ponce de León (+ 1584) einigen tauben 
Schülern aus vornehmem Hause beigebracht haben, flüssig zu sprechen. 
Seine Mittel und Methoden sind jedoch nicht unmittelbar überliefert, 
Manuskripte und vVeröffentlichungen verschollen. Auf die 
Untersuchungen und Methoden des Pietro Ponce geht jedoch das als 
ältestes neuzeitliches Werk über Sprechunterricht für Gehörlose geltende 
Buch des Kastiliers Juan Pablo Bonet (1620) Reduction de las letras y arte 
para enseñar a hablar los mudos (‘Die Vereinfachung des Alphabets und 
die Kunst, Taubstummen das Sprechen beizubringen’) zurück. Diese frühe 
Abhandlung beinhaltet bereits eine kurze physiologische Lautlehre, in 
der zu jedem Buchstaben des Spanischen die entsprechende Stellung der 
Mundteile beschrieben wird. Unabhängig von den spanischen 
Gehörlosenlehrern verfasste der Oxforder Mathematik-Professor John 
Wallis 1653 den Tractatus grammatico physicus de loquela, welchen er 
seiner Grammatica Linguae Anglicanae, einer Grammatik zum Unterricht 
des Englischen als Fremdsprache, voranstellte (Wallis 1653). In dem 
Bemühen um Vollständigkeit habe er, so Wallis in seiner Autobiographie 
(abgedruckt in Scriba 1970), in der Abhandlung erstmals alle Laute der 
gesprochenen Rede nicht nur des Englischen sondern aller ihm bekannten 
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Sprachen behandelt (Lateinisch, Griechisch, Hebräisch, Arabisch, 
Persisch, Deutsch, Französisch, Cymrisch, Gälisch).”! Auf Grundlage 
dieser physiologischen Lautlehre soll Wallis mehreren Gehörlosen 
erfolgreich das laute Lesen beigebracht haben. 

Die Untersuchungen von Brücke (1856) zum Deutschen und von Bell 
(1867) zum Englischen, die den Anfang der akademischen Phonetik im 
19. Jahrhundert markieren, beruhen noch ausschließlich auf subjektiver 
Beobachtung. Die Lautphysiologen Mitte des 19. Jahrhunderts gingen 
davon aus, dass zwischen die statischen Stellungsphasen zweier Laute 
kurze Gleitlaute („Anglitt“ und „Abglitt“) eingeschoben seien, die jeweils 
nicht den reinen Lauten entsprächen, sondern aus einer kontinuierlichen 
Reihe dazwischenliegender Übergangslaute bestünden, so dass ein 
kontinuierlicher Redefluss entstünde. Immerhin erwähnt Sievers (1876) 
schon die Möglichkeit, dass unter bestimmten Umständen 
antizipatorische Assimilationen zwischen Lauten eintreten können, dass 
also Artikulatoren vorzeitig ihre Stellung für nachfolgende Laute 
einnehmen, wenn sie nicht unmittelbar an der Produktion des aktuellen 
Lautes beteiligt sind und keine widerstreitenden Kräfte auf sie einwirken. 
Hermann Paul (1880) vertritt bereits einen erstaunlich modernen 
Standpunkt, indem er feststellt, dass gesprochene Sprache generell nicht 
segmentierbar sei und kein auf Buchstaben basierendes System geeignet 
sein könne, den Artikulationsprozess hinreichend genau zu beschreiben: 


21 “In the year 1653 I was persuaded to publish a Grammar of the English 
Tongue [...] To this I prefixed a Treatise of Speech (de Loquela) wherein I have 
Philosophically considered the Formation of all Sounds used in Articulate Speech, 
(as well of our own, as of any other Language that I know;) By what Organs, and 
in what Position each sound was formed; with the nice distinctions of each, 
(which in some letters of the same Organ, is very subtile) So that, by such Organs, 
in such Position, the Breath issuing from the Lungs, will form such Sounds, 
whether the Person do or do not hear himself speak. Which was, I think, a new 
attempt, not before undertaken by any (that I knew of) before that time. For tho! it 
were observed, that some letters were Labials, some Dentals, some Palatines, and 
some Gutturals; and some Grammarians have in some measure few shewed a 
different Formation in some few of the same Organ; yet it is but of very few they 
have so done; and very imperfectly; None (that I know of) had before attempted it, 
as to all; whatever may have been done since in pursuance of what I had then 
taught.” (Scriba 1970:41, Kursivsetzung und Streichung nach Scriba) 
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„Eine wirkliche Zerlegung des Wortes in seine Elemente ist nicht bloss sehr 
schwierig, sie ist geradezu unmöglich. Das Wort ist nicht eine 
Aneinandersetzung einer bestimmten Anzahl selbständiger Laute, von 
denen jeder durch ein Zeichen des Alphabetes ausgedrückt werden könnte, 
sondern es ist im Grunde immer eine kontinuierliche Reihe von 
unendlich vielen Lauten, und durch die Buchstaben werden immer 
nur einzelne charakteristische Punkte dieser Reihe in unvollkommener 
Weise angedeutet. Das Übrige, was unbezeichnet bleibt, ergibt sich 
allerdings aus der Bestimmung dieser Punkte bis zu einem gewissen Grade 
mit Notwendigkeit, aber auch nur bis zu einem gewissen Grade. Am 
deutlichsten lässt sich diese Kontinuität an den sogenannten Diphthongen 
erkennen, die eine solche Reihe von unendlich vielen Elementen 
darstellen, vgl. Sievers, Phonetik Kap. 19, 2. Durch Sievers ist überhaupt 
zuerst die Bedeutung der Übergangslaute nachdrücklich hervorgehoben. 
Aus dieser Kontinuität des Wortes aber folgt, dass eine Vorstellung von 
den einzelnen Teilen nicht etwas von selbst Gegebenes sein kann, sondern 
erst die Frucht eines, wenn auch noch so primitiven, wissenschaftlichen 
Nachdenkens, wozu zuerst das praktische Bedürfnis der Lautschrift geführt 
hat.“ (zitiert nach Paul 1995:834, im Wesentlichen jedoch so bereits in der 
1. Auflage von 1880. Hervorhebung im Original.) 


Mit Einführung der Kymographie*? wurde es im ausgehenden 19. 
Jahrhundert möglich, diverse Zustands- und Signaländerungen 
mechanisch aufzuzeichnen, etwa Luftströme, Zungenbewegungen, 
akustische Signale (Anfänge bei Rousselot 1897-1901, 1901-1908), und 
die Phonetik wurde zusehends zu einem primär experimentellen 
Forschungsgebiet (zu Methoden und Apparaten in der Anfangszeit vgl. 
Scripture 1902). Die heute als Koartikulation bezeichneten Phänomene 
ordnete man zunächst als Messfehler ein. Mit der Zeit wurde jedoch 
deutlich, dass auf Grundlage instrumenteller Messungen eine scharfe 
Grenzziehung zwischen einzelnen Lauten schlichtweg nicht möglich ist. 
Entdeckungen der Art, dass in CV-Sequenzen die Zunge und die Lippen 
regelmäßig noch während der Konsonantenartikulation ihre Stellung für 
den folgenden Vokal einnehmen, führten schließlich zur systematischen 
Untersuchung der Koartikulation und zur Formulierung von 
Koartikulationsprinzipien durch Menzerath & De Lacerda (1933). Sie 
postulierten, dass es keine stabilen Artikulatorpositionen in der 


22 Aufzeichnung physiologischer Zustandsänderungen in Kurvenform 


67 


gesprochenen Sprache gebe: ,,Sprechen ist Dauerbewegung [...] Es gibt — 
jedenfalls haben wir keinen Grund, das zu leugnen — bestimmte 
Artikulationsorte bzw. Artikulationsregionen, aber sie werden beim 
Sprechen nur in Bewegung durchlaufen“ (Menzerath & De Lacerda 
1933:58). Ihre Überlegungen basierten im Wesentlichen auf eigenen 
Studien über Lautfolgen bestehend aus Labialen und Vokalen im 
Deutschen (z.B. /ma/, /am/, /pu/, /up/). Aus der Untersuchung labialer 
Interaktion zwischen Konsonanten und Vokalen heraus formulierten sie 
zwei allgemeine Hauptprinzipien der Artikulation: Steuerung und 
Koartikulation. Der Begriff Koartikulation sollte besagen, dass die 
Artikulatoren während der Produktion eines Lautes bereits auf die 
Produktion nachfolgender Segmente vorbereitet werden, sofern sie an der 
Artikulation des aktuellen Segmentes nicht beteiligt sind. Davon 
unterschieden wurde der Begriff Steuerung, der sich auf die wechselseitige 
Beeinflussung oder gar Störung aufeinander folgender homorganer 
Sprachlaute bei konfligierenden Anforderungen an einen Artikulator 
bezog. Während sich Koartikulation also auf die parallele Artikulation 
ohne wechselseitige Störung bezog, bezeichnete Steuerung die 
Artikulationsabweichung, wenn ein und derselbe Artikulator für die 
Produktion zweier aufeinander folgender Laute benötigt wird. Diese 
Unterscheidung ist heutzutage unüblich und der Begriff „Koartikulation“ 
bezeichnet alle Fälle wechselseitiger Beeinflussungen von Lauten. 

In den 1960er Jahren etabliert sich in der Phonetik schließlich ein 
eigener Forschungsschwerpunkt zu koartikulatorischen Effekten der 
gesprochenen Sprache. Neben den rein phonetisch ausgerichteten 
Ansätzen (Kozhevnikov & Chistovich 1965; Öhman 1966; Perkell 1969; 
Wickelgren 1972; Bladon & Al-Bamerni 1976; Fowler 1980, 1981; 
Recasens 1984, 1987, 1989) entstand in den 1970er Jahren auch eine 
generative Denkschule, die mit Regeln und distinktiven Merkmalen 
arbeitete (Moll & Daniloff 1971; Daniloff & Hammarberg 1973; 
Benguerel & Cowan 1974) und durch Keating (1988; 1990) an die nicht- 
lineare Phonologie (Goldsmith 1990) angeschlossen wurde. Als 
Gegenentwurf zu diesen eher phonologischen Ansätzen wurden 
dynamische Koproduktionstheorien entworfen, die von sich 
überschneidenden artikulatorischen Gesten statt von distinktiven 
Merkmalsbündeln als Grundeinheiten der Lautproduktion ausgingen 
(Fowler 1980; Fowler & Saltzman 1993; Bell-Berti & Harris 1981, 1982; 
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Kelso, Saltzman & Tuller 1986; Browman & Goldstein 1986, 1989; 
Saltzman & Munhall 1989). In neueren Jahren scheinen sich beide 
Positionen wieder einander anzunähern, indem die Frage nach der 
Diskretheit artikulatorischer Gesten gestellt wird, die bei den distinkten 
Merkmalen bereits per definitionem vorgegeben ist (Goldstein 2003). 
Artikulatorische Gesten werden primär einzelnen Artikulationsorganen 
zugeordnet, ganz ähnlich wie distinktive Merkmale. 

Grundlegend für die Idee der Koartikulation ist die Vorstellung, dass 
für Wörter nicht vollständige artikulatorische Realisationspläne en bloc in 
den Köpfen der Sprecher abgespeichert sind, sondern dass diese Wörter 
aus einzelnen, unveränderlichen Einheiten aufgebaut sind, auf die die 
Sprecher zurückgreifen können und die der kontinuierlichen und 
veränderlichen Sprachproduktion zugrunde liegen. Die allgemeine 
Charakteristik eines solchen einzelnen Lautes ist in einem abstrakten 
Segment, sei dies nun ein Bündel distinktiver Merkmale oder eine 
artikulatorische Geste, repräsentiert. Denn wäre die Bewegung der 
einzelnen Artikulatoren zur Realisation eines Wortes wie Kuhle [k"u:l>] 
als Ganzes und bis in jedes Bewegungsdetail hinein in einem mentalen 
Artikulationsplan gespeichert, müssten die regelmäßigen Muster im 
Lautkontinuum als Zufall angesehen werden. Nur die Annahme 
distinkter, abstrakter Grundeinheiten erlaubt es, die regelmäßig 
auftretenden Ähnlichkeitsbeziehungen, die bei der artikulatorischen 
Realisation einzelner solcher Einheiten in vielen Sequenzen zu 
beobachten sind, in Koartikulationsprinzipien zusammenzufassen. 

Die Feststellung der Phonetiker des 19. Jahrhunderts, dass keine 
Einzellaute im Schallstrom auffindbar oder messbar sind, erwies den 
phonologischen Lautbegriff als theoretischen Begriff, als ein Hilfsmittel 
zur Beschreibung und Deutung von Mustern, die im Schallstrom 
feststellbar sind. Die Elemente in der gesprochenen Sprache sind nicht 
distinkt und werden nicht invariant realisiert.”” Der wichtigste Grund 


3 Zur Veranschaulichung distinkter und invarianter Einheiten wählen Kühnert 
& Nolan (1997:62) den Vergleich mit einer Schreibmaschine, die mit ihren 
unveränderlichen Typen mehr oder weniger identische Buchstaben auf das Papier 
druckt. Die Realisierung eines Wortes besteht dagegen aus kontinuierlichem 
Sprachschall, der durch ineinander übergehende Bewegungsabläufe der 
Sprechorgane produziert wird. 
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dafiir ist, dass die Form des Vokaltrakts der Reihe nach den 
Anforderungen der einzelnen Laute einer Sequenz angepasst werden 
muss. Aufgrund physischer Beschränkungen können die Artikulatoren 
und der Mundraum nicht augenblicklich von einer Konstellation zur 
nächsten wechseln. Während der Zeit, die zum Wechsel der 
Artikulatorenkonfiguration benötigt wird, bleibt die Rede nicht stehen, 
sondern läuft kontinuierlich weiter. Artikulation ist gerade keine Abfolge 
separater Einzellaute, sondern ein fließender Prozess. Dabei wäre es ja 
durchaus möglich, zwischen den einzelnen Lauten eines Wortes eine 
kurze Pause zu lassen, in der die Artikulatoren die passende Stellung für 
den nächsten Laut einnehmen könnten. Das Ergebnis wäre so etwas wie 
[k® - y: - 1] statt [k"yıll. Der Zeitaufwand und wohl auch der 
Energieaufwand beim Sprechen würden allerdings erheblich zunehmen. 
Koartikulation erscheint aus diesem Blickwinkel als intelligente 
Lösung, um schnell und effizient sprechen zu können. Wenn möglich, 
werden Artikulatoren schon früher als unbedingt notwendig in Stellung 
gebracht, damit sie trotz ihrer Trägheit rechtzeitig die gewünschte 
Zielkonfiguration erreichen. Das Ergebnis dieser Vorwegnahme ist 
regressive Assimilation von rechts nach links. Andererseits verharren die 
Artikulatoren aufgrund ihrer Trägheit länger als unbedingt nötig in einer 
einmal eingenommenen Position. Das Ergebnis des längeren Verharrens 
ist progressive Assimilation von links nach rechts. Koartikulation ist also 
in gewisser Hinsicht der Preis flüssiger Artikulation, welcher der Trägheit 
der Artikulatoren geschuldet ist. Andererseits lässt die Koartikulation 
dem Hörer auch mehr Zeit, die akustischen Signale eines Phonems 
wahrzunehmen und zu interpretieren, da die Informationen über das 
Vorhandensein eines Phonems nicht nur während eines kurzen, 
beschränkten Zeitabschnitts anzutreffen sind. So zeigte sich auch in 
Wahrnehmungstests (z.B. Fowler 1984, 2005), dass Koartikulation für 
den Hörer eine wichtige Hilfe zur schnellen Interpretation und zum 
richtigen Verständnis von Lautsequenzen ist. Die Realisationsdauer eines 
Phonems beschränkt sich nicht nur auf den Zeitraum, in dem die 
akustischen Korrelate dieses Phonems in der Lautfolge dominant sind, 
sondern sie erstreckt sich auch über die vorangehende wie nachfolgende 
Koartikulationsphase. Da der Hörer fest damit rechnet, dass gesprochene 
Sprache Koartikulation aufweist, kompensiert er unwillkürlich die 
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wechselseitige Beeinflussung der Laute und nimmt sie ohne gezielte 
Schulung gar nicht bewusst wahr.”* 

Diese Erkenntnisse der phonetischen Forschung helfen, die 
allophonische Umlautphase im Vor- oder Frühalthochdeutschen 
stichhaltig zu rekonstruieren. Intervokalische Koartikulation von /i/ oder 
/j/ mit /a(:), o(:), uC)/ muss auch in der allophonischen Umlautphase 
des Vor- und Frühalthochdeutschen stattgefunden haben und ist damit 
als phonetische Basis für jene Umlautalternanzen in Betracht zu ziehen, 
die in den alt- und mittelhochdeutschen Texten zu entdecken sind. Wie 
ein näherer Blick auf die Muster intervokalischer Koartikulation zeigen 
wird, bestehen auffällige Parallelen zwischen der im Phonetiklabor 
gemessenen vokalischen Koartikulation und dem i-Umlaut im 
Althochdeutschen. 

Die relevanten Faktoren sind dabei: 

1. die sprecherseitige Koartikulation zwischen zwei Vokalen in 

benachbarten Silben, 

2. die hörerseitige Kompensation der Koartikulation. 
Anschließend kann davon ausgehend die Koartikulation für 
voralthochdeutsche bzw. frühalthochdeutsche Sprecher hypothetisiert 
werden. 


3. Intervokalische Koartikulation 


Koartikulation beschränkt sich nicht auf benachbarte Laute, sondern 
breitet sich regelmäßig von einer Silbe zur nächsten aus. Und auch 
Wahrnehmungstests zeigen, dass koartikulatorische Cues zur 
Identifikation von Lauten über verschiedene Silben verteilt sein können 


24 Die Vorstellung, dass separate Laute auch separat produziert werden 
müssten, verhinderte lange Zeit Forschritte in der künstlichen Sprachsynthese. So 
wurden im 19. und 20. Jahrhundert Geräte entwickelt, die für jeden Vokal ein 
separates künstliches Ansatzrohr als Resonator enthielten. Die so synthetisierten 
Schallfolgen mussten entsprechend unnatürlich, die Wörter bis zur 
Unkenntlichkeit verzerrt klingen. Die Geschichte wiederholte sich bei 
computerbasierter Sprachsynthese, wo lange Zeit separate Einzellaute aneinander 
gehängt wurden. 
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(Treon 1970; Clark & Sharf 1973; Whalen 1990). Antizipierende Effekte 
(von rechts nach links) werden für gewöhnlich psychologisch durch 
artikulatorisches Vorausplanen der Sprecher erklärt, progressive Effekte 
(von links nach rechts) dagegen werden physiologisch der Trägheit der 
Artikulatoren zugeschrieben (MacNeilage & DeClerk 1969; Gay 1977; 
Recasens 1984, 1987; Huffman 1986; Recasens, Fontdevila & Pallarés 
1995). Dabei überschreitet nicht nur die Koartikulation des relativ 
schwerfalligen Zungenriickens die Silbengrenzen (vgl. Fowler 1981 fiir 
das Englische; Vayra, Fowler & Avesani 1987 zum Italienischen, wo 
Koartikulation bis in die übernächste Silbe wirkt), sondern gleiches gilt 
auch fiir andere Artikulatoren wie die Lippen und das Velum (siehe die 
Daten fiir amerikanische Sprecher bei Bell-Berti & Harris 1979; Bell-Berti, 
Baer, Harris & Niimi 1979; Bell-Berti & Harris 1982). Auch zwischen den 
Vokalen benachbarter Silben besteht eine mehr oder weniger ausgepragte 
Koartikulationsbeziehung. Während antizipatorische Effekte der 
Koartikulation von Vokal zu Vokal unabhängig vom Sprechtempo sind, 
werden progressive Koartikulationseffekte oft reduziert (Hertrich & 
Ackermann 1995). Die Ausprägung der Koartikulation sowie die Stärke 
der Koartikulationshemmung bei konfligierenden 
Artikulationsanforderungen variiert stark von Sprecher zu Sprecher 
(Nolan 1985; van den Heuvel, Cranen & Rietveld 1996; Fowler & 
Brancazio 2000). Langsames Sprechtempo verringert zwar bei vielen 
Sprechern die Neigung, Vokale zu reduzieren, und verbessert die 


25 Eine grundlegende Frage ist, ob progressive und regressive Koartikulation 
unterschiedlich weit in benachbarte Silben hineinwirken können. Während 
anfangs bei progressiver Koartikulation eine größere Reichweite vermutet wurde 
als bei regressiver, widersprechen jüngere Untersuchungen dieser Vermutung. Es 
sind keine Reichweitenunterschiede zwischen progressiver und regressiver 
Koartikulation festzustellen. Nach phonologisch orientierten Untersuchungen gibt 
es ebenfalls keine Anzeichen für universale Unterschiede in der Reichweite von 
progressiver und regressiver Vokalharmonie. Die Assimilationsrichtung scheint 
vielmehr durch die Konstruktionsprinzipien der Einzelsprachen festgelegt zu sein. 
Bei stammbasierter Vokalharmonie in hauptsächlich suffigierenden Sprachen 
breiten sich die harmonisierenden Merkmale progressiv von links nach rechts aus. 
In hauptsächlich präfigierenden Sprachen breitet sich die stammbasierte 
Vokalharmonie dagegen regressiv von rechts nach links aus. Der Wirkungsbereich 
dieser Vokalharmonien ist aber immer das gesamte Wort. 
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Artikulationsgenauigkeit, jedoch hat das Sprechtempo keinen 
signifikanten Einfluss auf die Dauer einzelner Laute, sondern äußert sich 
eher in der Länge der Pausen zwischen den Wörtern, welche bei 
langsamem Sprechen länger werden. 

Verschiedene Faktoren beeinflussen die Ausbreitung und Stärke 
intervokalischer Koartikulation. Da die Unterscheidbarkeit einzelner 
Phoneme hörerseitig von großer Bedeutung ist und phonemische 
Kontraste nach Möglichkeit nicht verwischt werden sollen, hängt das 
Ausmaß der Koartikulation wesentlich von der Anzahl und Verteilung der 
vokalischen und konsonantischen Phoneme im artikulatorischen bzw. 
akustischen Raum ab. Es gilt: Je kleiner das Vokalinventar einer Sprache, 
desto stärker zeigen sich Koartikulationseffekte (Manuel 1990). 
Außerdem werden Koartikulationseffekte zwischen zwei Vokalen 
abgeschwächt, wenn palatale oder velare Konsonanten zwischen den 
beiden Vokalen stehen. Dies ist darauf zurückzuführen, dass die 
Artikulationsbewegungen des Zungenkörpers bei palatalen und velaren 
Konsonanten in Konflikt stehen mit den Artikulationsbewegungen des 
Zungenkörpers während der Vokalproduktion (Öhman 1966; Purcell 
1979; Butcher & Weiher 1976; Recasens 1984; Recasens, Fontdevila & 
Pallarés 1995). Wie stark und auf welche Weise die Koartikulation durch 
solche phonemischen Beschrankungen beeinflusst wird, variiert von Laut 
zu Laut und von Sprache zu Sprache (Martinet 1952, 1957; Schouten & 
Pols 1979; Engstrand 1988; Manuel & Krakow 1984; Keating & Huffman 
1984; Manuel 1990; Nguyen & Fagyal 2005). 

Das physische Prinzip intervokalischer Koartikulation hat Ohman 
(1966) in einer klassischen Untersuchung mit Sonagrammen und 
Röntgenaufnahmen beschrieben. Er untersuchte bei schwedischen, 
russischen und amerikanischen Sprechern die Assimilationsprozesse von 
Vokal zu Vokal über Plosive hinweg (V,CV,). Dabei stellte er fest, dass 
die Form der Mundhöhle sich bereits während der Verschlussphase des 
Plosivs ändern kann; ferner erkannte er, dass die Zungenstellung des 
nachfolgenden Vokals zu dieser Zeit zwar nicht ganz eingenommen, aber 
doch wesentlich vorbereitet wird. Auch akustisch konnte er anhand von 
Formantmessungen zeigen, dass der Folgevokal V, die Formanttransition 
von V, zu C deutlich beeinflusst und die Artikulationsbewegung für den 
Folgevokal V, bereits zu Beginn des Konsonanten C einsetzt. VCV- 
Äußerungen können nicht als lineare Abfolge von drei separaten Lauten 
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aufgefasst werden. Vielmehr überlagern sich die Bewegungen der 
Artikulationsorgane zur Produktion verschiedener Laute sehr deutlich. 
Vokale werden gleichzeitig mit ihren benachbarten Konsonanten 
produziert, wobei die artikulatorischen Gesten zur 
Konsonantenproduktion gleichsam auf eine durchgehende 
diphthongische Vokalgeste aufgesetzt erscheinen. Diese Ergebnisse 
wurden später mehrfach in palatographischen und physiologischen 
Studien für Sprecher verschiedenster Sprachen bestätigt und detaillierter 
beschrieben (Perkell 1969; Kent 1972; Kent & Moll 1972; Butcher & 
Weiher 1976; Recasens 1984, 1987; Fowler 1981, 2005; Whalen 1990). 

Ein weiteres wichtiges Ergebnis war, dass die zwischenstehenden 
Konsonanten unterschiedlich stark an der Koartikulation zwischen den 
Vokalen einer V,CV,-Sequenz teilhaben. Im Rückblick auf eine Vielzahl 
weiterer Studien zu Koartikulationseffekten kommen Fowler & Saltzman 
(1993) zu dem Ergebnis, dass bestimmte, hochgradig 
koartikulationsresistente Konsonanten eine artikulatorische Barriere für 
die gleichzeitig ablaufenden, konfligierenden phonetischen Gesten 
bilden. Zwar lassen sich antizipatorische Koartikulationseffekte des 
zweiten Vokals V, schon beim Einsetzen der Realisation des ersten Vokals 
V, nachweisen, jedoch nimmt die Stärke dieser Koartikulationseffekte 
während der Realisation bestimmter Konsonanten in Position C deutlich 
ab (Recasens 1984). Besonders koartikulationsresistent erscheinen dabei 
solche Konsonanten, deren Realisation die Bewegungsmöglichkeit des 
Zungenrückens während der Öffnungsphase stark einschränkt, wie etwa 
dorso-palatales /j/ oder alveo-palatales /n/. Die freie Kontraktion und 
Relaxion der für die Koartikulation verantwortlichen Muskelgruppen 
wird aber nur kurzzeitig innerhalb der konsonantischen Verschluss- und 
Öffnungsphase beschränkt. In den vorangehenden und nachfolgenden 
Phasen ist der Bewegungsablauf im Wesentlichen frei. Gleichzeitig üben 
diese Konsonanten auch den stärksten koartikulatorischen Effekt auf ihre 
lautliche Umgebung aus, d.h. sie stellen starke artikulatorische Gesten 
dar, die vor koartikulatorischen Störungen weitestgehend geschützt sind, 
während schwächere Gesten stärker der Koartikulation unterliegen 
(neuere Studien zur Koartikulationsresistenz z.B. in Recasens, Fontdevila 
& Pallarés 1995; Fowler & Brancazio 2000; Fowler 2005). 

Bedingt verwertbare Ergebnisse für die Umlautfrage im 
Althochdeutschen lieferte eine Forschungsreihe über Vokalharmonie und 
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Metaphonie in französischen Dialekten (Fagyal, Nguyen & Boula de 
Mareiiil 2002; Nguyen, Fagyal & Cole 2004; Nguyen & Fagyal 2005). Die 
eingeschrankte Vergleichbarkeit von Metaphonie und Umlaut ergibt sich 
daraus, dass zwar die Assimilationsrichtungen tibereinstimmen, jedoch 
die Betonungsverhältnisse umgekehrt sind. Bei der Koartikulation im 
Französischen beeinflusst der betonte Vokal der letzten Silbe die Qualität 
des unbetonten Vokals der ersten Silbe. Nguyen & Fagyal (2005) stellten 
fest, dass der Umfang vokalharmonischer Koartikulation vom Dialekt der 
Sprecher abhängt. Die Koartikulation zwischen benachbarten Vokalen bei 
nordfranzösischen Sprechern ist deutlich systematischer ausgeprägt als 
bei südfranzösischen Sprechern. Daraus folgern die Autoren, dass 
Vokalharmonie nicht den universalen, biomechanischen Eigenschaften 
des menschlichen Vokaltrakts zugeschrieben werden könne, sondern 
einen Teil des sprachlichen Wissens der Sprecher darstelle. Durch 
vertauschtes Aneinanderkopieren einzelner Silben eines Wortes konnten 
die Autoren auch nachweisen, dass Hörer die subphonemischen, 
vokalharmonischen Cues im betonten Vokal zur schnellen und korrekten 
Identifizierung der Qualität vorangehender unbetonter Vokale nutzen 
(vgl. auch Fagyal, Nguyen & Boula de Mareüil 2002; Nguyen, Fagyal & 
Cole 2004). Zudem traten die koartikulatorischen Effekte unabhängig 
davon auf, ob zwischen den Vokalen eine Morphemgrenze vorkam oder 
nicht. Für die Lösung der Umlautfrage im Althochdeutschen ergeben sich 
zwei schwache Anhaltspunkte: (a.) Die Stärke der Koartikulation dürfte 
auch während der voralthochdeutschen Sprachperiode dialektabhängig 
gewesen sein. (b.) Morphemgrenzen sind keine Barrieren für regressive 
Vokalassimilation. 

Im Hinblick auf den Umlaut im Althochdeutschen sind noch zwei 
spezielle Beobachtungen aus anderen Studien von Interesse. Zum einen 
kann intervokalische Koartikulation über mehrere Silben hinwegreichen. 
Insbesondere wird in einer Lautsequenz /CV.CV.CV/ der artikulatorische 
Übergang von dem betonten Vokal der ersten Silbe zu dem betonten 
Vokal der dritten Silbe nur in geringem Maße durch den unbetonten 
Vokal in der mittleren Silbe beeinflusst. Der unbetonte Vokal scheint 
lediglich sekundär auf die Trajektion der Mundhöhle von einem betonten 
Vokal zum nächsten betonten Vokal aufgesetzt (Martin 1972; Fowler 
1980). In gleicher Weise wirkt bei einer Sequenz V,CaCV, die 
Koartikulation zwischen den betonten Vokalen V, und V, über das Schwa 
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hinweg (Magen 1989; Magen 1997). Für den Umlaut im 
Althochdeutschen bedeutet dies zum einen, dass der Umlaut durch i in 
dritter Silbe (frühahd. magadi > spätahd. megedi) parallel zur 
phonetischen Koartikulation verläuft. Andererseits spielt es, zumindest 
im Englischen, keine Rolle für das Ausmaß der Koartikulation zwischen 
/a/ und /i/, ob die Vokale jeweils in einer haupt- oder in einer 
nebentonigen Silbe stehen (Magen 1997). Sollte dieser Befund allgemein 
gelten, so wäre der i-Umlaut von Anfang an auch in unbetonter Silbe zu 
erwarten, wenn ein betontes i vorausgeht. Fälle dieser Art sind aber nicht 
für das Frühalthochdeutsche nachzuweisen (Formen wie ahd. stimme < 
stimna, finger < fingar etc. sind erst ab dem 10./11. Jahrhundert 
nachweisbar und damit Zeichen der Nebensilbenreduktion, der Wechsel 
von (a) zu (e) ist hier kein Umlaut). 

Die frühzeitige Antizipation vokalischer Stellungsmerkmale vor der 
konsonantischen Öffnungsphase dient besonders bei langsam 
beweglichen Artikulatoren, wie etwa dem Dorsum, dazu, dass die 
Artikulatoren die gewünschte Stellung zur Artikulation von V, später 
überhaupt erreichen. Dabei ist es plausibel, folgende Korrelationen 
anzunehmen. 


(14) Korrelationen zwischen Vokallänge und Einsetzen der 
Koartikulation 


(14a) Je kürzer der erste Vokal V,, desto früher setzt in der 
Realisationsphase von V, die Antizipation der 
Stellungsmerkmale von V, ein. 


(14b) Je weiter die notwendige Artikulatorbewegung bei der 
Trajektion von V, zu V,„ desto stärker treten 
Koartikulationseffekte in V, auf. 


Was den Umlaut im Althochdeutschen betrifft, ist also die stärkste 
Koartikulation zwischen dem Kurzvokal /a/ und einem /i/ zu erwarten, 
da die Koartikulation bereits zu Beginn der a-Artikulation einsetzt und 
der artikulatorische Abstand zwischen /a/ und /i/ der maximal mögliche 
ist. 

Im Übrigen scheint es keinen Unterschied für das Einsetzen der 
vokalischen Koartikulation in V, zu machen, ob stärker oder schwächer 
koartikulationsresistente Konsonanten folgen. Die Koartikulation von V, 
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setzt immer mit ungefähr gleichem Abstand zu V, ein. Dies deutet darauf 
hin, dass koartikulationsresistente Konsonanten während der 
Öffnungsphase lediglich kurzzeitig hemmend auf die Koartikulation 
wirken. Ihr Einfluss auf das Einsetzen und Ausklingen der Trajektion von 
V, zu V, ist nicht signifikant. 


4. Kompensation der Koartikulation 


Für die Erkennung eines Zeichens durch einen Rezipienten ist es nicht 
entscheidend, ob der Rezipient das Zeichen vollständig oder ungestört 
wahrnimmt, sondern dass er ausreichend Hinweise darauf erhält, welches 
der verschiedenen möglichen Zeichen gemeint ist. Dies gilt für akustische 
Zeichen genauso wie für optische Zeichen. Die korrekte Erkennung 
gestörter und unvollständiger Zeichen ist bei festgelegten Symbolen 
besonders erfolgreich: Fehlende oder überdeckte Teile werden vom 
Rezipienten schnell und zuverlässig virtuell ergänzt. Die Beispiele in (15), 
(16) und (17) illustrieren diese virtuelle Ergänzung bei optischen Zeichen 
anhand von unvollständigen und gestörten Piktogrammen und 
Buchstabenfolgen. 


(15) Unvollständige Zeichen werden durch den Rezipienten ergänzt 


(15a) Was besagt dieses Piktogramm? 


(15b) Was sagt folgender Text aus? 


Dio Snrarho ict urio iodoc Frzonianic moncrhlirhor Kııltır oin 
u A ee eh nei Fat eee Tet © are nr in TS RT ED) SOMONE ae tan za 


Coaonctand dor nocrhirhtlirhon Rotrachthina 
hr ei = ner a hee gen ae ay = 2 
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(16) Gestörte Zeichen werden durch den Rezipienten korrigiert 


(16a) Was bedeutet dieses Piktogramm? 


(16b) Was sagt folgender Text aus? 


(17) Zeichen, die sowohl unvollständig als auch gestört sind, werden 
durch den Rezipienten korrigiert 


(17a) Was bedeutet dieses Piktogramm? 


A 


(17b) Was sagt folgender Text aus? 


Genauso genügt es einem Hörer, ausreichend Hinweise darauf zu 
erhalten, welche Laute eigentlich hätten produziert werden sollen, um 
ein Wort korrekt zu verstehen. Es ist nicht notwendig, dass er die 
gesamte Lautsequenz vollständig und ungestört hören kann. Der 
Nachweis dieser Behauptung gelingt auch außerhalb eines 
Phonetiklabors. Dazu genügt es, ein reparaturbedürftiges Radio 
einzuschalten, bei dem aufgrund eines technischen Defektes einerseits ein 
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dumpfes Poltern das Schallsignal stört, andererseits selbiges hin und 
wieder einige Sekundenbruchteile lang durch absolute Stille 
unterbrochen wird. Dennoch ist es möglich, Wortbeiträgen zu folgen. 
Auch ein Rauschen im Fernsehton oder ein Knacken in der Telefonleitung 
ist zwar ein Ärgernis, meist jedoch kein Hindernis, die übermittelte 
Nachricht zu verstehen. Die Bedingung dafür ist lediglich, dass das Signal 
ausreichend Hinweise darauf enthält, welche Lautfolge im 
ursprünglichen, ungestörten Signal vorhanden gewesen sein muss. Selbst 
von Rauschen oder Unterbrechungen komplett verschluckte Wörter — 
vor allem einzelne Funktionswörter — können in den meisten Fällen mit 
großer Sicherheit gedanklich ergänzt werden, solange ausreichend 
Kontext vorhanden ist.” 

Deutliche Hinweise für die hörerseitige Rekonstruktion oder die 
virtuelle Vervollständigung solcher gestörten, akustischen Signale liefern 
phonetische Perzeptionstests. Hörer rechnen damit, dass sich phonetische 
Gesten in gesprochener Sprache überschneiden, dass eine Geste 
typischerweise bereits in der Domäne einer vorangehenden Geste beginnt 
(Antizipation) und in der Domäne einer nachfolgenden Geste endet 
(Perserveration), und sie kompensieren diese Koartikulationseffekte, 


2° Eine Beobachtung zur zeitlichen Dimension: Ein regelmäßiges, extremes 
Störsignal (sei es nun Knallen oder Stille) scheint deutlich weniger das Verständnis 
zu erschweren als extreme Geschwindigkeitsvariation. Ein besonders schnell 
abgespieltes Tonband enthält zwar theoretisch noch immer 100 Prozent des 
ursprünglichen akustischen Signals, dennoch kann man ab einer bestimmten 
Geschwindigkeit nicht mehr folgen, selbst wenn die Frequenzerhöhung, die mit 
der höheren Abspielgeschwindigkeit einhergeht, künstlich herausgerechnet wird. 
Noch schwerer dürfte das Verstehen fallen, wenn die Abspielgeschwindigkeit des 
Tonbands immer wieder zwischen normaler und beschleunigter Geschwindigkeit 
variiert. Auch extrem verlangsamtes Abspielen macht das Verstehen unmöglich. 

Das Fortschreiten der Zeit ist nun aber beim natürlichen Sprechen sowohl für 
den Sprecher als auch für den Hörer kontinuierlich und konstant, d.h. die Zeit 
verläuft für Sprecher und Hörer regelmäßig und gleich schnell. In der zeitlichen 
Dimension treten keine Störungen bei der Signalübermittlung zwischen Sprecher 
und Hörer auf, die der veränderten Abspielgeschwindigkeit des Tonbands 
entsprechen würden. Es scheint, dass der Mensch besser mit Störungen in der 
akustischen Dimension (Störgeräusche) als in der zeitlichen Dimension 
(Geschwindigkeitsvariation) zurechtkommt. 
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indem sie einzelne Abschnitte des Schallkontinuums relativ zur lautlichen 
Umgebung interpretieren. 

Zahlreiche neuere phonetische Untersuchungen unter dem Stichwort 
Koartikulationskompensation (engl. compensation of coarticulation) zielen 
auf genau diese Art hörerseitiger Rekonstruktion ab (unter anderem 
Mann & Repp 1980, 1981; Repp & Mann 1981, 1982; Fowler 1984; Lotto 
& Kluender 1998; Fowler 2006; Hallé & Best 2007). Eine Reihe 
klassischer Untersuchungen wurde zur Unterscheidung von /da/ 
gegenüber /ga/ durchgeführt, insbesondere im Hinblick auf den Einfluss 
vorausgehender /ar/- und /al/-Sequenzen. Die Engebildung während des 
Verschlusses von /d/ und /g/ in Sequenzen wie [alda], [alga], [arda], 
[arga] stellt eine Mischung aus zwei Engebildungsgesten dar: der 
Engebildung von /d/ bzw. /g/ und der Engebildung des vorausgehenden 
/t/ bzw. /l/. Die pharyngale Engebildung des /r/ bewirkt eine 
Verschiebung des Artikulationspunkts der folgenden Verschlusslaute /d/ 
oder /g/ weiter nach hinten in Richtung Pharynx. Die Engebildung des 
/\/ mit der Zungenspitze bewirkt umgekehrt eine Verschiebung des 
Artikulationspunktes nachfolgender /d/- oder /g/-Laute nach vorne. 
Wird zudem das /r/ gerundet gesprochen (z.B. von amerikanischen 
Sprechern), so wirkt die Rundungsgeste des /r/ auch noch auf die 
nachfolgende Silbe. 

Einer der ersten Versuche zur /da/-/ga/-Unterscheidung stammt von 
Virginia Mann (1980). Sie ersetzte in den natürlichen Token [alda], 
[alga], [arda], [arga] die hinteren CV-Sequenzen durch synthetisierte 
Stimuli, die aus einem Kontinuum von [da] bis [ga] stammten (d.h. mit 
sinkendem initialen F3-Wert von [d] zu [g], F1- und F2- Werte blieben 
ebenso wie der finale F3-Wert in allen Stimuli gleich)”. Informanten 
sollten beurteilen, welche Liquide und welche Plosive sie in den so 
entstandenen, hybriden Zweisilbern hörten. Ambige Elemente aus den 
synthetischen [da]-[ga]-Reihen wurden dabei nach [ar] eher als /da/ 
interpretiert, nach [al] eher als /ga/. Erklärt werden kann dieser Effekt 
dadurch, dass aufgrund der Koartikulation in der gesprochenen Sprache 
ein hinteres, gerundetes [r] den hohen F3-Wert eines nachfolgenden [d] 
senkt, dass aber ein apikales [l] den F3-Wert eines nachfolgenden [g] 
anhebt. Die Hörer schrieben den relativ niedrigen F3-Wert eines ambigen 


? F1, F2 und F3 stehen für die ersten drei Formanten im Resonanzspektrum 
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[da]-Elements nach [ar] der senkenden Wirkung des [r] zu und 
interpretierten es als /da/. Stand dasselbe ambige [da]-Element nach 
[al], so interpretierten sie das Element eher als /ga/. Die Hörer 
berücksichtigten bei ihrer Interpretation der synthetisierten Stimuli also 
den Frontierungsseffekt, den [al] beim natürlichen Sprechen auf [ga] 
ausübt, d.h. sie kompensierten Koartikulationseffekte. 

Auch antizipatorische Koartikulation wird kompensiert. Mann & Repp 
(1980) wiesen nach, dass die Identifizierung von Frikativen entlang eines 
/s/-/§/-Kontinuums vom Folgevokal abhängt. Vor folgendem /u/ wurde 
eher ein /s/ wahrgenommen, vor /a/ eher ein /J/. Die Hörer 
kompensierten dabei den senkenden Effekt, den die antizipierte 
Lippenrundung auf das Spektrum des vorangehenden Frikativs hat. 
Später stellten Mann & Soli (1991) sowohl Kompensation der 
Koartikulationseffekte zwischen Vokalen und Frikativen bei VC-Silben 
(perseverativ) als auch bei CV-Silben (antizipatorisch) fest. Fowler (1984) 
zeigte, dass die antizipatorische Koartikulation in /gi/- und /gu/-Silben 
in gleicher Weise kompensiert wird. 

Den Einfluss, den die hörerseitigen Erwartungen und die Phonotaktik 
der Muttersprache auf die Lautwahrnehmung haben, untersuchten 
kürzlich Halle & Best (2007). Französische Hörer interpretieren 
hebräische wortinitiale /tl/- und /dl/-Sequenzen, die in ihrer 
französischen Muttersprache verboten sind, als /kl/- und /gl/-Sequenzen, 
solche Lautfolgen also, die im Französischen zulässig sind. Offenbar 
unterliegen /tl/ und /dl/ einer phonotaktisch-perzeptuellen Assimilation 
(Halle, Segui, Frauenfelder & Meunier 1998). Auch amerikanische Hörer 
nehmen die in ihrer Muttersprache ebenfalls nicht zulässigen Lautfolgen 
/tl/ und /dl/ eher als /kl/ und /gl/ wahr. Diese Uminterpretation von 
/dl/ und /tl/ zu /gl/ bzw. /kl/ findet nicht statt bei hebräischen Hörern, 
in deren Muttersprache die vier fraglichen Sequenzen /tl, dl, gl, kl/ 
neben anderen Plosiv +Liquid-Sequenzen wie /dr, tr, gr, kr/ wortinitial 
zulässig sind und kontrastieren (Hallé & Best 2007). Die Ergebnisse 
zeigen, dass die perzeptuelle Assimilation stark von der 
sprachspezifischen Phonotaktik des Hörers abhängt. 

Während in den zuvor beschriebenen Experimenten vornehmlich 
Nonsens-Wörter als Stimuli gebraucht wurden, untersuchten Elman & 
McClelland (1988) gezielt den Einfluss der Lexik auf die Interpretation 
einzelner Laute (frühere Arbeiten z.B. Morton 1969; Grosjean 1980; 
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Ganong 1980). Dazu synthetisierten sie zwei Reihen hybrider Laute, 
wobei die Laute der einen Reihe akustisch zwischen [t] und [k] lagen, 
die der anderen Reihe zwischen [d] und [g]. Hierfür manipulierten sie 
die Frequenz und Amplitude der Verschlussöffnungsgeräusche, das 
Einsetzen und die Dauer der Formantentrajektionen sowie die 
Stimmeinschwingzeiten (engl. voice onset time = VOT) so, dass ein 
gradueller Ubergang vom natiirlichsprachlichen [t] zu [k] bzw. von [d] 
zu [g] geschaffen wurde. Fir das Experiment wurden nur ambige 
Plosivlaute aus dem mittleren Kontinuumsbereich gewählt. Diesen 
hybriden Plosiven ließen sie die Sequenzen [eıpes], [ertes] und [i:r] 
folgen, so dass jeweils englische Wörter entstanden: eine der Reihen 
variierte zwischen engl. tapes und capes, eine andere zwischen dates und 
gates, eine dritte zwischen deer und gear. Die so synthetisierten Wörter 
wurden in verschiedene Kontexte eingebettet: den Stimuli aus dem 
Kontinuum tapes-capes ging entweder das Wort Christmas oder das Wort 
foolish voraus; den dates-gates-Stimuli gingen die Wörter copious oder 
English voraus, den dear-gear-Stimuli gingen die Wörter Spanish oder 
ridiculous voraus. In einem ersten Durchgang wurde geprüft, wie stark die 
Hörer Koartikulationseffekte zwischen auslautendem Frikativ [s] bzw. [f] 
des vorangehenden Wortes und anlautendem Plosiv [t], [k], [d], [g] 
kompensierten. Wie erwarte, kompensierten die Hörer die 
Koartikulation, indem sie die ambigen [t]-[k]-Plosive nach einem [f] 
tendenziell eher als [t] oder [d], nach einem [s] tendenziell eher als [k] 
oder [g] wahrnahmen. Für den zweiten Durchgang wurde jeweils der 
auslautende Frikativ der vorangestellten Wörter (Chrismas, foolish; 
copious, English; Spanish, ridiculous) so hybridisiert, dass er akustisch 
zwischen [s] und [f] lag. Der hybride Frikativ wurde in Isolation von den 
Hörern zu 50 Prozent als [s], zu 50 Prozent als [f] klassifiziert. Würde 
die Koartikulationskompensation allein auf phonologischer Ebene 
ablaufen, so die Idee von Elman & McClelland, müsste sich nun die 
Anzahl der [t]- und der [k]-Antworten angleichen (tapes so oft wie capes) 
sowie die der [d]- und [g]-Antworten (dates so oft wie gates, deer so oft 
wie gear). Jedoch hing die Koartikulationskompensation davon ab, in 
welchem lexikalischen Kontext die Hörer den hybriden Frikativ 
wahrnahmen. Je nach vorangehendem Wort interpretierten die Hörer 
den hybriden Frikativ als [s] oder [f], obwohl ein und derselbe hybride 
Frikativ als Stimulus diente. Standen die hybriden Plosive hinter den 
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Sequenzen Christma+X, copiou+X oder ridiculou+X, kompensierten die 
Hörer die Koartikulation so, als hätten sie an der Stelle X ein [s] gehört, 
d.h. der folgende hybride Laut wurde als [t] oder [d] wahrgenommen. 
Standen die hybriden Plosive in den Sequenzen fooli+X, Engli+X oder 
Spani+X, kompensierten die Hörer die Koartikulation so, als hätten sie 
an der Stelle X ein [f] gehört, d.h. der folgende hybride Laut wurde als 
[k] oder [g] wahrgenommen. Auch die Manipulation der vorausgehenden 
Vokale, die ja ihrerseits bereits koartikulatorisch vom Frikativ beeinflusst 
sein könnten, änderte nichts Wesentliches am Ergebnis. Elman & 
McClelland (1988) folgerten daraus, dass die höhere, lexikalische Ebene 
mit der tieferen, perzeptuellen Ebene interagiert (top-down-processes). 

Wie weit diese Entscheidung zwischen /k/ und /t/ bzw. /g/ und /d/ 
bereits auf perzeptiver Ebene stattfindet ist eine offene Frage der 
phonetischen Forschung: Beeinflusst die lexikalische Repräsentation 
tatsächlich unsere Wahrnehmung der Laute, indem Informationen von 
der höheren Ebene lexikalischer Repräsentationen zur tieferen Ebene 
phonemischer Codes fließen (interaktive Modelle, z.B. McClelland & 
Elman 1986; Elman & McClelland 1988; Samuel & Pitt 2003), oder 
verlauft der Informationsfluss unidirektional von der tieferen Ebene 
phonemischer Codes zur höheren Ebene lexikalischer Repräsentationen 
(Cutler, Mehler, Norris & Segui 1987; Eimas, Marcovitz Hornstein & 
Payton 1990; Massaro & Oden 1995)? Beeinflussen die lexikalischen 
Repräsentationen lediglich unsere Entscheidungen, wie wir Laute 
klassifizieren, wenn wir z.B. in einem Phonetikexperiment darum gebeten 
werden (Norris, McQueen & Cutler 2000)? Fest steht zumindest, dass 
lexikalisches Wissen die hörerseitige Interpretation von Lauten und 
Lautfolgen beeinflusst. So spielt es eine Rolle, ob die verwendeten Stimuli 
in einem Perzeptionstest Pseudowörter oder lexikalische Wörter sind. 
Phoneme werden in Pseudowörtern langsamer erkannt als in echten 
Wörtern (Rubin, Turvey & van Gelder 1976), ambige Phoneme werden 
ihrem lexikalischen Kontext entsprechend interpretiert (Pitt 1995), 
fehlende Phoneme werden in lexikalischen Wörtern häufiger von den 
Hörern ergänzt als in vergleichbaren Pseudowörtern (Samuel 1996), und 
die Verarbeitungsgeschwindigkeit der Phoneme innerhalb von 
Pseudowörtern hängt von der Ähnlichkeit dieser Pseudowörter zu echten 
Wörtern ab (Connine, Titone, Deelman & Blasko 1997; Wurm & Samuel 
1997). 
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Für den Umlaut im Althochdeutschen ist ebenfalls anzunehmen, dass 
lexikalisches Wissen die kognitive Verarbeitung der Umlautvokale stark 
beeinflusst hat. Die Vokalgraphien bleiben daher stabil, als sich 
Umlautallophone bereits entwickelt haben. Auch Frequenzeffekte bei 
häufig gebrauchten Wörtern oder bei bestimmten Lautfolgen können 
dann zum Teil durch die Interaktion von phonetischer Perzeption und 
lexikalischem Wissen erklärt werden (Pitt & Samuel 1995). Wenn ein 
althochdeutscher Sprecher selbst nur die Form [haltis] verwendet, wird 
er als Hörer auch die Aussprache [haltis] mit palatalisiertem Vokal [a] 
auf die ihm bekannte Flexionsform haltis ‘halten (2. Sg.)’ beziehen. 
Während der allophonischen Umlautphase besteht gar keine 
Verwechslungsgefahr bei irgendeiner umgelauteten Wortform, da die 
Umlautvokale nicht mit ihren velaren Entsprechungen kontrastieren. Der 
Hörer wird [haltis] höchstens für eine undeutliche Aussprache von 
[haltis] halten. So, wie französische Hörer ein hebräisches [dl] am 
Wortanfang zu [gl] uminterpretieren, hatte auch im Althochdeutschen 
die Erwartung der Hörer entscheidenden Einfluss auf die Interpretation 
auditiv ungewohnter Lautungen. Im Gegensatz zu der [dl]-[gl]- 
Kompensation im Französischen, wo [d] und [g] eigenständige Phoneme 
sind, stand in der allophonischen Umlautphase des Althochdeutschen 
nicht einmal eine Phonemgrenze der Koartikulationskompensation 
entgegen. 


5. Phonemisierung als Aussetzen der 
Koartikulationskompensation 


Die Phonemisierung der Umlautallophone ist eine der großen, offenen 
Fragen der Umlautforschung. Wie lässt sich der Wandel erklären, der aus 
dem Blickwinkel der Phonologen als Wandel vom Allophon zum Phonem 
konzeptualisiert wird? Was passierte, als aus allophonischen 
Umlautvarianten Phoneme wurden? Ein wesentlicher Baustein der 
Erklärung dürfe in dem Aussetzen der hörerseitigen 
Koartikulationskompensation zu finden sein. Dass dieser phonetische 
Aspekt bisher in keiner Umlauttheorie berücksichtigt wurde, ist wohl auf 
das weit verbreitete Desinteresse der Phonologen an phonetischen 
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Erklärungen und umgekehrt das Desinteresse der Phonetiker an 
phonologischen (zumal lauthistorischen) Theorien zurückzuführen. 

Koartikulatorische Assimilationen zwischen aufeinander folgenden 
Vokalen eines Wortes treten zu allen Zeiten und bei allen Sprechern 
unausweichlich auf — bei germanischen Sprechern ebenso, wie heute 
noch bei deutschen, französischen und amerikanischen Sprechern. 
Unterschiede bestehen lediglich hinsichtlich der spezifischen Ausprägung 
und Stärke der Koartikulation. Diese Spezifika variieren stets zwischen 
verschiedenen Sprechergruppen, ob es sich nun um chronologisch oder 
um dialektal geschiedene Sprecher handelt. Es wäre fahrlässig, die 
Koartikulation zwischen Vokalen nicht als phonetische Grundlage für den 
Umlaut im Althochdeutschen zumindest in Erwägung zu ziehen. So ist 
die Annahme durchaus gerechtfertigt, dass V-zu-V-Koartikulation bereits 
bei Sprechern des Germanischen und Althochdeutschen auftrat, wenn 
auch nicht in exakt der gleichen Weise wie bei heutigen Sprechern. Wir 
kennen aber die ungefähre Richtung der Koartikulation zwischen 
bestimmten Vokalen, nämlich zwischen betontem /a, o, u/ und 
nachfolgendem, unbetontem /i/ im Germanischen und 
Althochdeutschen. Denn für diese speziellen Konstellationen lässt sich die 
Richtung der Koartikulation mit großer Sicherheit rekonstruieren (unter 
der Annahme, dass Koartikulation auch wirklich die Ursache der 
Umlautentstehung ist). Demnach wirkte das unbetonte /i/ palatalisierend 
auf die ursprünglichen Hinterzungenvokale. Zusätzlich wurde der tiefe 
Vokal /a/ in den meisten Fällen in Richtung auf [e] gehoben. Dass vor 
bestimmten Konsonanten lediglich die Palatalisierung in Richtung auf [a] 
(ohne Hebung zu [e]) eintrat, kann nicht dadurch erklärt werden, dass 
die artikulatorischen Gesten der entsprechenden Konsonanten einer 
Hebung entgegengestanden hätten. Koartikulationsresistente 
Konsonanten haben nur kurzzeitig Einfluss auf das Ausmaß der 
Koartikulation, nämlich nur während der Artikulationsphase des 
Konsonanten. Die diphthongische Geste, mit der der Übergang von einem 
Vokal zum nächsten beschrieben werden kann, wird von diesen 
Konsonanten nur sehr kurzfristig gestört. 

Die Stärke der Koartikulation zwischen /a, o, u/ und /i/ im 
Germanischen und Althochdeutschen war schwach genug, dass die Hörer 
problemlos die Koartikulation zwischen [i] und [a, ø, y] kompensieren 
konnten. Was sie bewusst hörten, waren einfach nur die betonten Laute 
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a, 0, u vor einem unbetonten i. Assimilationstendenzen zwischen den 
Vokalen wurden hörerseitig aus dem Schallkontinuum ‚herausgerechnet’, 
genauso wie es heutige Hörer bei VC,V-Sequenzen tun. Die 
Koartikulation muss sich aber im Laufe der Zeit verstärkt haben, und 
zwar so weit, dass gegen Anfang der althochdeutschen Sprachperiode die 
nachfolgenden Sprecher- bzw. Hörergenerationen die Koartikulation 
nicht mehr kompensierten. Diese späteren Generationen nahmen bewusst 
oder unbewusst einen Unterschied zwischen den Lauten a, o, u auf der 
einen Seite und den Lauten ä, ö, ü und e auf der anderen Seite wahr. Dies 
taten sie, weil sie nicht gelernt hatten, die mittlerweile stärker 
gewordene Koartikulation in Abhängigkeit vom Folgevokal zu 
kompensieren. 

Eine vergleichbare Entwicklung nimmt derzeit die Allophonie der ich- 
/ach-Laute im heutigen Standarddeutschen. Die Allophone des Phonems 
/¢/ werden entlang eines kontinuierlichen Spektrums vom palatalen [ç] 
bis zum uvularen [x] realisiert. Die Sprecher erkennen jedoch innerhalb 
dieses Kontinuums zwei Klassen [¢] und [x/x], wobei die Verteilung der 
[c]- und [x/xl-Varianten in der Regel von der Qualität der 
vorangehenden Laute abhängt. Insbesondere folgt [x/x] auf hintere 
Vokale und [c] auf Konsonanten und vordere Vokale. Die Teilung des 
Spektrums in zwei Klassen zeigt sich deutlich darin, dass die 
angenommene Verteilungsregel im Standarddeutschen nicht mehr 
ausnahmslos gilt, und zwar nicht nach vokalisiertem /r/: durch [duec], 
Kirche [kreca], schnarchen [fna:econ]. Nach der angenommenen 
Verteilungsregel müssten auf den hinteren [e]-Laut Allophone aus dem 
[x/x]-Spektrum folgen. Tatsächlich aber wird palatales [ç] gesprochen, 
so als sei der /r/-Laut nicht zu [e] vokalisiert worden. Damit übernimmt 
[ç] eine Kennzeichnungsfunktion hinsichtlich des vokalisierten /r/: [ec] 
steht nun für die Phonemfolge /rc/. Mit Ronneberger-Sibold (1990) lässt 
sich [ç] hier als Index auffassen, der die Dekodierung des undeutlich 
gewordenen /R/ erleichtert. Ermöglicht wird diese Indexfunktion durch 
die noch intakte Koartikulationskompensation bei [ç] und [x/x]. Die 
Hörer berücksichtigen, dass vor [ç] kein hinterer Vokal stehen kann und 
interpretieren daher den vorangehenden Laut als Allophon des 
Konsonanten /R/. 

Im Althochdeutschen ist nun das Aussetzen der 
Koartikulationskompensation seitens der Hörer der entscheidende Schritt 
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fiir das Einsetzen der sogenannten Phonemisierung der Umlaute. Solange 
die Koartikulation hörerseitig kompensiert wurde, handelte es sich bei [a, 
ø, y] um gewöhnliche, allophonische Varianten zu /a, o, u/. Konnte ein 
Spracherwerber den Zusammenhang zwischen den palatalen Varianten 
und ihren velaren Ursprungslauten nicht mehr herstellen, so gab es für 
ihn drei Laute mehr als für Sprecher der vorangehenden Generationen. 
Diese drei neuen Laute [a, ø, y] standen noch nicht in phonologischer 
Opposition zueinander. Darum waren sie im strukturalistischen Sinne 
auch noch keine eigenständigen Phoneme, sondern weiterhin Allophone. 
Viel wichtiger als diese theoretische Beschreibung ist jedoch die 
praktische Folge, dass sich in der sprachlichen Kommunikation zunächst 
gar nichts änderte. Denn in den realisierten Wortformen hatte dieser 
kognitive Unterschied keine Entsprechung. Sprecher der Generation G, 
sprachen genauso wie Sprecher der nachfolgenden Generation G,,, das 
Wort hati ‘Haut (Pl.)’ als [hy:ti] aus. Jedoch fassten sie die Lautform 
unterschiedlich auf. Generation G, interpretierte sie als Realisation der 
Lautfolge /hu:ti/, G,,, dagegen als Realisation der Lautfolge /hy:ti/. 

Mit dieser phonologischen Re-Interpretation der Umlautvarianten 
hörte die Koartikulation freilich nicht auf zu wirken. Vor allem zog das 
unbetonte iin den umgelauteten Wortformen weiterhin die Umlautvokale 
näher zu sich, zumal für die Sprecher, die keinen Bezug mehr zwischen 
[a, ø y] und /a, o, u/ herstellen konnten, keinerlei Veranlassung 
bestand, die auditive Nähe zu den velaren Lauten [a, o, u] beizubehalten. 
Im Gegenteil wird ihnen die Stärkung der auditiven und artikulatorischen 
Opposition zwischen velaren Vokalen [a, 0, u] und palatalen Vokalen [a, 
ø, y] natürlich und unauffällig vorgekommen sein. Und da die neuen 
Umlaute ebenfalls mit den Lauten ihrer Umgebung koartikulierten, 
etablierten sich Streubereiche der Umlautartikulation, deren Zentren 
deutlich im palatalen Artikulationsraum lagen. Höchstens den Sprechern 
der ältesten Generation mag an der jüngeren Generation deren in ihren 
Ohren extreme akustische Annäherung von /a, o, u/ an [i] aufgefallen 
sein — ohne dass die Verständigung jemals dadurch gefährdet gewesen 
wäre. Den Lauf des Vokalwandels ändern konnten die Sprecher ohnehin 
nicht mehr. Alle folgenden Generationen erlernten zwei verschiedene 
Vokalgruppen [a, o, u] und [a, ø, y], ohne diese beiden Gruppen jemals 
mittels Koartikulationskompensation aufeinander beziehen zu können. 
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Unter diesen neuen Voraussetzungen fiel die Koartikulation zwischen 
kurzem [a] und [i]/[j] besonders stark aus (so wie auch heute noch die 
Koartikulation zwischen [a] und [i] stärker ist als die zwischen [o] und 
[i] oder [u] und [i]). Das Ergebnis lässt sich deutlich an der 
orthographischen Wiedergabe der Umlaut-Reflexe des a erkennen: sie 
werden schon althochdeutsch meist als (e) geschrieben. 
Erstaunlicherweise war die Koartikulation vor unbetontem [i] so stark, 
dass der /a/-Laut den artikulatorischen Streubereich des alten 
germanischen, offenen [e] überspringen konnte und als geschlossenes [e] 
gesprochen wurde. Darauf weisen sowohl der Reimgebrauch der Dichter 
als auch die Reflexe in modernen Dialekten hin (Braune & Reiffenstein 
2004: 834, Anm. 1). 


(18) Schematische Darstellung der Streubereiche der Koartikulation 
Zwischen /a/ und geschlossenem /e/ liegt der Streubereich des 
offenen /é/. 


Wie konnte der Umlaut des a (=/e/) den Artikulationsbereich des 
germanischen /&/ und damit eine Phonemgrenze gleichsam 
überspringen? Entscheidend hierfür war, dass der Unterschied zwischen 
/é/ und neuem Umlautphonem /a/ vor einem unbetonten /i/ 
neutralisiert wurde, indem beide als geschlossener [e]-Laut realisiert 


wurden, *® solange diese Hebung des Vokals nicht durch die 


?8 In einer Sprachperiode deutlich vor dem i-Umlaut ist ein betontes 
germanisches ë vor unbetontem i gehoben worden zu i. Doch in einigen Fällen 
kam germ. é nachträglich vor i zu stehen, vgl. ahd. felis, pelliz, ledig, welih (Braune 
& Reiffenstein 2004: 828, Anm. 1). In diesen Fällen wurde germ. € dann im 
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konsonantische Umgebung verhindert wurde. Die Streubereiche der 
betonten Vokale /a/ und /é/ überschnitten sich also vor unbetontem /i/. 


(19) Die artikulatorischen Streubereiche von /a/ und /é/ bei folgendem 
unbetontem /i/ decken sich (= Neutralisation). 


a 


Vergleicht man die schematischen Darstellungen in (18) und (19), so 
liegt die Realisation des /é/ (bei nachfolgendem /i) im 
Artikulationsbereich des /e/. Der Streubereich des /a/-Phonems ist sehr 
weit ausgedehnt, wobei /a/ in hebungshindernder Lautumgebung (ht, hs, 
rw, Ih etc.) offen realisiert wird, ansonsten geschlossen. 

In der fraglichen Lautumgebung _C,i verschob sich also nicht nur der 
artikulatorische Streubereich des Umlauts von /a/, sondern auch der 
Streubereich des /é/. Tatsächlich durchkreuzt die Primärumlaut-Variante 
nicht den Bereich des /é/, sondern fällt mit ihm in dieser spezifischen 
Lautumgebung zusammen. 

Ein solcher Zusammenfall mit alten Phonemen war für die gerundeten 
Umlautvarianten [y] und [ø] nicht möglich, da es im Germanischen 
keine gerundeten Vordervokale gab, mit denen sie hätten 
zusammenfallen können. Erst durch spätere Entrundung der Umlaute (im 
Bairischen seit dem 12. Jahrhundert) oder Rundung von [e] und [i] vor 
/\/, /S/, Labialen oder Affrikaten (seit dem 13. Jahrhundert im 
Alemannischen, seit dem 14. Jahrhundert im Schwäbischen und 
Ostfränkischen) fielen bei einigen Wörtern die Umlaute mit ursprünglich 
ungerundeten Lauten gleicher Zungenstellung zusammen. 


Althochdeutschen regelmäßig als geschlossenes [e] realisiert und fiel so mit dem 
Primärumlaut e zusammen (weitere Beispiele bei Kauffmann 1888). 
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Auch bei der Entrundung von /ø/ und /y/ spielt die Koartikulations- 
kompensation eine wichtige Rolle, indem die Sprecher der älteren 
Generation noch nicht kompensierten, was jiingere Generationen 
durchaus kompensierten. So kann die Lippenrundung eines [ø] oder [y] 
als Perserveration der Lippenrundung eines vorangehenden, gerundeten 
/t/ oder /f/ interpretiert werden in Wörtern wie mhd. grüene, schoene. 
Sobald Hörer die progressive Labialkoartikulation, die von /r/ und /J/ zu 
erwarten ist, kompensieren, interpretieren sie die Lautfolge [gryana] als 
/grione/ und [fø:nə] als /fe:na/. Auch die Kompensation der regressiven 
Labialkoartikulation von /m/ und /pf/ für vorhergehende Vokale kann 
z.B. bei den Wörtern mhd. gümpel, güpfel dazu führen, dass deren 
Umlautvokale als der Sprecherintention nach ungerundete Vokale 
aufgefasst werden. Durch diese Koartikulationskompensation wird die 
Lautfolge [gympel] als /gimpel/, [gypfel] als /gipfel/ interpretiert. 

Umgekehrt ist die Rundung von [e] und [i] zu [ø] bzw. [y] vor /{/ 
und Labialen eine Folge aktiver regressiver Koartikulation. Die 
Lippenrundung der labialen Laute wird antizipatorisch 
vorweggenommen, so dass den mittelhochdeutschen Formen leschen, helle 
die neuhochdeutschen Formen löschen, Hölle entsprechen. Die 
Stammvokale in mhd. schepfen, schrepfen standen gleich von zwei Seiten 
aus unter Labialisierungsdruck, da dem e labiale Laute vorangehen und 
folgen. Nun hätte hier zwar die Koartikulationskompensation aufgrund 
des vorangehenden /{/ bzw. /fr/ einsetzen können, jedoch war der 
Rundungseffekt offenbar so stark, dass die Hörer das gerundete [ø] zu 
deutlich wahrnahmen, als dass sie die Effekte der Lippenrundung hätten 
kompensieren können. Die antizipatorische Koartikulation war in diesen 
Fällen also stärker als die mögliche Kompensation der Koartikulation. So 
konnten die gerundeten Varianten schöpfen, schröpfen lexikalisiert 
werden. Dabei gilt auch in diesen Fällen die oben beschriebene 
Reihenfolge, dass nämlich auf eine Phase, in der die sprecherseitige 
Koartikulation von den Hörern kompensiert wird, eine Phase folgt, in der 
die jüngere Generation die Koartikulation nicht mehr kompensiert und 
somit andere Laute hört als die ältere Generation.” 


2 Zwar ist der physikalische Schall, der gehört wird, für beide derselbe, jedoch 
wird er unterschiedlich interpretiert. „Hören“ findet im Kopf statt: Wo der eine 
einen /e/-Laut hört, hört der andere einen /o/-Laut. 
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Dieses Aufgeben der Koartikulationskompensation ist eine wichtige 
Voraussetzung dafiir, dass lautliche Veränderungen der 
Koartikulationsauslöser nichtt mehr in einer Veränderung der 
koartikulierten Laute resultieren. Der i-Umlaut ist dafür ein gutes 
Beispiel, denn die den Umlaut initiierenden [i] wurden ab dem 9. 
Jahrhundert in Nebensilben zu [a] reduziert.” Weil [a] im Gegensatz zu 
[i] und [j] keine umlautähnliche Koartikulation beim Stammvokal 
bewirkt, hätte die Koartikulation in den Stammvokalen nach der 
Nebensilbenabschwächung zurückgehen müssen. Auf lautlicher Ebene 
blieb im Althochdeutschen jedoch alles beim Alten, weil die neuen 
Umlautallophone sich kognitiv von ihren velaren Ursprungsvarianten 
gelöst hatten und für die Sprecher bereits eigene Artikulationsziele 
darstellten. Die palatalen Vokalvarianten hingen nicht mehr davon ab, 
dass ein [i] oder [j] folgte. 

Bleibt die Koartikulationskompensation seitens der Hörer dagegen 
erhalten, so verändert sich die Koartikulation des Stammvokals im 
Gleichschritt mit den Veränderungen in den Koartikulationsauslösern. 
Für den Umlaut lässt sich dies anhand der niederländischen Dialekte 
illustrieren. Auf niederländischem Gebiet finden sich (mit Ausnahmen an 
den östlichen Randgebieten) lediglich Reflexe des sogenannten 
Primärumlauts a > e. Von den frühesten, mittelniederländischen 
Denkmälern an bis heute fehlen Anzeichen für die übrigen Umlautvokale 
/aC), øC), yG)/. Daraus ist zu schließen, dass in den niederländischen 
Dialekten nur der Umlaut des kurzen a zu e phonemisiert wurde. Dies ist 
am einfachsten dadurch zu erklären, dass die Koartikulation zwischen 
kurzem a und i bei Hebung zu e besonders stark ausfiel (so wie es auch in 
den althochdeutschen Dialekten der Fall war) und darum nur für diesen 
Einzellaut die Koartikulationskompensation aussetzte. Die bei den 
übrigen Vokalen durchaus vorhandene Koartikulation mit i war 
schwächer und wurde daher weiterhin kompensiert. Vor allem gilt dies 
auch für die Lautumgebungen, die im Althochdeutschen zu 
Sekundärumlaut führten, die also die Hebung des kurzen a zu e 
verhinderten: Im Niederländischen wurde phonetisches [a] in diesen 


30 In den Denkmälern erscheinen dann die Vokalgrapheme (e), (i), (a) für den 
reduzierten Vokal, da dieser kein eigenes Graphem hat. Auch heute muss sich /a/ 
den Buchstaben (e) mit dem Vollvokal /e/ teilen. 
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Umgebungen weiterhin kompensiert und als Variante von /a/ 
interpretiert. Als in den niederländischen Dialekten die 
Nebensilbenabschwächung einsetzte, verschwand überall dort, wo die 
Koartikulation hörerseitig kompensiert worden war, auch die palatale 
Koartikulation der Stammvokale. Nur e stellte als Ausnahmefall ein 
eigenes Artikulationsziel dar und blieb als einziges Relikt der früheren 
Koartikulationsverhältnisse in den niederländischen Dialekten erhalten. 

Die Phonemisierung der Umlautvokale vollzog sich demnach in 
mehreren Phasen, die unter (20) dargestellt sind. 


(20) Phonemisierung der Umlautvokale in vier Phasen 


Phase 1: Sprecherseitige Koartikulation und hörerseitige Kompen- 
sation der Koartikulation kennzeichnen die allophonische 
Umlautphase 

Phase 2: Sprecherseitige Koartikulation ohne hörerseitige Kompen- 
sation führt zur kognitiven Entkoppelung der Umlaut- 
varianten von den ursprünglichen Hinterzungenvokalen 

Phase 3: Weitere Wirkung der Koartikulation und damit 
Entwicklung neuer artikulatorischer Streubereiche sowie 
Stärkung der Opposition zwischen velaren und palatalen 
Vokalen 

Phase 4: Reduktion der Nebensilben sowie Morphologisierung des 
Umlauts (= Phonemisierung im strukturalistischen Sinne, 
da Umlaute jetzt erst distinktiv und nicht mehr 
komplementär verteilt sind.) 
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Teil IV Ansatz zu einer Umlauttypologie 


1. Aufbau von Teil IV 


Teil IV beginnt im Abschnitt Stärke- und Schwächepositionen mit einer 
Definition von Stärke- und Schwächepositionen innerhalb eines Wortes. 
Schwach sind Positionen, in denen Laute abgebaut werden, wie z.B. in 
unbetonter Silbe, im Silbenendrand, in der postinitialen Position 
zwischen anlautendem Konsonant und Nukleus. 

Aufbauend auf dieser Definition wird im Abschnitt Definition des 
Umlauts zunächst eine Begriffsbestimmung für Umlautprozesse im 
Allgemeinen gegeben und mit anderen möglichen Umlautdefinitionen 
verglichen. Umlautprozesse gehen nach der hier vorgelegten Definition 
immer nur von Schwächepositionen aus und unterscheiden sich dadurch 
von Vokalharmonie, die immer nur von Stärkepositionen ausgeht. 

Im Abschnitt i-Umlaut im Althochdeutschen werden die phonologischen 
Bedingungen für den althochdeutschen i-Umlaut festgehalten. Von der 
reinen Palatalisierung velarer Vokale werden die phonologischen 
Bedingungen für die Hebung des a bzw. é vor i unterschieden. Entgegen 
den bisher üblichen Umlautdefinitionen wird in diesem Abschnitt 
dargelegt, dass der i-Umlaut im Althochdeutschen sowohl regressiv (von 
rechts nach links), als auch progressiv (von links nach rechts) verläuft, 
solange die i-Laute in einer Schwächeposition stehen. 

Parallel zu den Bedingungen für i-Umlaut werden im Abschnitt u- 
Umlaut im Althochdeutschen die Bedingungen für u-Umlaut angegeben und 
auf die Monophthongierung von ahd. iu und auf den Lautwandel ahd. au 
> ou angewandt. Im Abschnitt ahd. ao > 6 als o-Umlaut wird schließlich 
auch die Monophthongierung von ahd. ao zu 6 im Auslaut unter die 
Umlauterscheinungen subsumiert. 


2. Stärke- und Schwächepositionen 


Um den Umlaut richtig beschreiben und verstehen zu können, werden im 
Folgenden „starke“ und „schwache“ Positionen innerhalb eines Wortes 
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unterschieden. „Schwach“ sollen all jene Positionen heißen, in denen 
Laute bevorzugt abgebaut werden, d.h. schwinden oder geschwächt 
werden, „stark“ all jene Positionen, in denen Laute bevorzugt gestärkt 
werden, d.h. epenthetisch eingefügt werden oder neue phonemische 
Kontraste entwickeln. Schwächepositionen werden im Folgenden jene 
Stellen der Silbenstruktur genannt, in denen Laute im Laufe der 
geschichtlichen Entwicklung einer Sprache abgebaut werden. Zur 
topologischen Beschreibung der Silbe, wird der Aufbau einer Silbe nach 
folgendem Schema strukturiert. 


(21) Struktur einer Silbe 


Silbe 
ga T] 
Kopf Reim 
en 
Sn Koda 
initial postinitial nuklear postnuklear final 


Die Reihenfolge der einzelnen Laute in der Silbe richtet sich prinzipiell 
nach dem Sonoritätsprinzip. Eine Version dieses Prinzips ist in (22) 
formuliert (siehe auch Sievers 1901; Jespersen 1904; Vennemann 1972a; 
Hooper 1972; Selkirk 1984). 
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(22) Sonoritatsprinzip 


Vom Nukleus aus zu den Silbenrändern hin darf die Sonorität der 
Laute nicht abnehmen.** 


(23) Regeln der lautlichen Füllung einer Silbe 


Kopf/Anfangsrand Reim 
Nukleus Koda/Endrand 
K_, Kı V Kyi Kis 
initial postinitial | nuklear postnuklear final 
möglichst möglichst möglichst möglichst möglichst 
konsonantisch sonor sonor sonor konsonantisch 
höchst i h 
a ne auch mehrfach Ren höchstens au 
einfach einfach i mehrfach 
besetzt einfach besetzt 
besetzt besetzt besetzt 
(vokalisch (vokalisch 
oder oder 
konsonantisch) konsonantisch) 
selichst selichst ; 
ns g : rae ic 2 Be möglichst nicht gefüllt 
gefüllt wenig gefüllt | gefüllt 


möglichst 
wenig gefüllt 


Position V bezeichnet den Nukleus der Silbe, der immer mit genau einem 
Laut gefüllt ist, und zwar jenem Laut, dessen Sonorität höher ist als die 


Sonorität der Laute in seiner unmittelbaren Umgebung. Positionen K_, 
und K_, bilden gemeinsam den Anfangsrand der Silbe, der möglichst 
gefüllt ist, und zwar möglichst nur auf Position K_,. Die initiale Position 


K_, ist der Silbenanlaut und wird mit höchstens einem Laut besetzt, der 
möglichst eine hohe konsonantische Stärke aufweist; die postinitiale 
Position K_, bleibt möglichst ungefüllt oder wird höchstens mit Vokalen 


oder schwachen Konsonanten besetzt. Die Positionen K,, und K,, bilden 


31 Sowohl ein Sonoritätsanstieg als auch ein Sonoritätsplateau (in Sprachen mit 


silbeninternen Geminaten) sind erlaubt. 
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gemeinsam den Endrand der Silbe, der bevorzugt nicht gefiillt ist. Die 
postnukleare Position K,, wird mit höchstens einem Konsonanten oder 
Vokal besetzt, der möglichst schwach ist; die finale Position K,, ist der 
Silbenauslaut und bleibt bevorzugt ungefüllt oder wird mit möglichst 
starken(!) Konsonanten gefüllt. Die Positionen K_,, V und K,, können 
nur einfach besetzt werden. Die Positionen K_, und K,, können auch von 
mehreren Lauten besetzt werden. 

Diese Strukturbedingungen der Silbe gehen konform mit dem 
Kopfgesetz für Silben („Head Law“ nach Vennemann 1988:13f.): Die 
Konsonantenstärke soll innerhalb des Kopfes zum Nukleus hin möglichst 
stark abfallen. Da der Anfangsrand K_,K_, zwar möglichst gefüllt sein 
soll, aber nicht auf Position K_,, steht möglichst ein einzelner, starker 
Konsonant in Position K_,. Wenn der Anfangsrand mit mehr als einem 
Laut gefüllt ist, so steht der erste Laut in Position K_, (und ist ein 
möglichst starker Konsonant), die übrigen Laute in Position K_, (und sind 
möglichst schwache Konsonanten oder Vokale). 

Ebenso findet sich das Kodagesetz für Silben („Coda Law“ nach 
Vennemann 1988:21) darin: Die Position K,, bleibt möglichst unbesetzt. 
Wenn ein einzelner Laut im Endrand steht, dann steht er in Position K,,, 
die mit einem möglichst schwachen Konsonanten oder Vokal besetzt 
wird. Stehen zwei Laute im Endrand, so steht der erste Laut einzeln in 
Position K,, und ist ein möglichst schwacher Vokal oder Konsonant, die 
übrigen Laute stehen in Position K,, und sind möglichst starke 
Konsonanten. 

Schwächepositionen innerhalb einer betonten Silbe sind nun jene 
Positionen, die möglichst unbesetzt bleiben, also die pränukleare Position 
K_,, die postnukleare Position K,,, sowie der Endrand K,,K,, insgesamt, 
vgl. (24). In einer unbetonten Silbe sind alle Positionen schwach. 
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(24) Schwächepositionen 


(24a) innerhalb einer betonten Silbe: K_,, K,,, Ka 


Kopf/Anfangsrand Reim 
Nukleus Koda/Endrand 
K_, K_, V Ky, K,5 
Schwäche- 
j T ° Schwächeposition 
position 


(24b) innerhalb einer unbetonten Silbe: alle Positionen 


Kopf/Anfangsrand Reim 
Nukleus Koda/Endrand 
Kes K v Ki, Ks 
Schwächeposition 


An diesen Stellen innerhalb eines Wortes werden Laute im Laufe der 
sprachlichen Entwicklung bevorzugt abgebaut. 
Wenn Laute reduziert werden, dann entlang folgender Skalen unter (25). 


(25) Präferenzskalen für K_,, K,,, K,. 


(25a) Skala für Position K_, 
kein Laut > einfacher Vokal > einfacher Konsonant > 
Konsonant+ Vokal > mehrere Konsonanten 


(25b) Skala für Position K,, 
kein Laut > einfacher Vokal > einfacher Konsonant 


(25c) Skala fiir Position K,, 
kein Laut > einfacher Konsonant > mehrere Konsonanten 


„X > Y“ bedeutet dabei, dass X in dieser Position bevorzugt ist 
gegenüber Y (oder: X besser als Y ist). Es ist besser, dass K_,, K,,, K42 
ungefiillt sind, als dass dort ein einfacher Laut steht. Ein einfacher Vokal 
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in Stellung K_, oder K,, ist besser als ein einfacher Konsonant usw. Die 
Position K,, ist eine doppelte Schwächeposition: Wenn der Endrand 
gefüllt wird, dann zunächst auf der Position K,,, erst danach auf Position 
K,> 


3. Definition des Umlauts 


Der Umlaut unterscheidet sich von typischen vokalharmonischen 
Prozessen dadurch, dass beim Umlaut die Qualität eines unbetonten 
Vokals systematisch die Qualität benachbarter Vokale bestimmt. Dass die 
Unbetontheit des umlautauslösenden Vokals ein wesentliches 
Charakteristikum des Umlauts ist, wird sowohl in früheren als auch in 
den neuesten Arbeiten zu Umlautphänomenen meist nur kurz erwähnt 
und als selbstverständliche Strukturbedingung der Umlautumgebung 
hingenommen. Dass es sich bei der Assimilationsrichtung vom 
unbetonten zum betonten Vokal aber um eine seltene sprachtypologische 
Besonderheit handelt, wird bisher höchstens in Fußnoten zu Aufsätzen 
über Vokalharmonie erwähnt und als isoliertes Kuriosum einiger weniger 
(namentlich germanischer) Sprachen dargestellt. Zumindest in der 
germanistischen Umlautforschung scheint man sich der Besonderheit des 
Umlauts im Vergleich zu anderen intervokalischen Assimilationen nicht 
weiter bewusst zu sein. In der Folge wurden die formalen 
Gemeinsamkeiten der verschiedenen Umlaute in den germanischen 
Sprachen ausgeblendet und die Unterschiede in den Fokus genommen. 
Da es jedoch im Grunde genommen um Prozesse derselben Art geht — 
die gemeinsame Bezeichnung Umlaut ist ja nicht unberechtigt — lohnt 
sich auch der Blick auf die formalen Übereinstimmungen der 
Umlautausprägungen in den einzelnen germanischen Sprachen. Ein erster 
Schritt zu einer Typologie des Umlauts, die sowohl Gemeinsamkeiten als 
auch Unterschiede berücksichtigt, ist von Sonderegger (1959) 
unternommen worden. Fünf Forschungsjahrzehnte später ist es an der 
Zeit, diesen Ansatz wieder aufzugreifen und auf den neuesten Stand zu 
bringen. 

Sonderegger (1959) hat einen Überblick über verschiedene 
Umlautbegriffe erstellt, wie er sie in der Forschungsliteratur verwendet 
findet. Allgemein gesprochen handle es sich beim Umlaut um eine 
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„Modifikation der Vokale durch assimilierenden Einfluß benachbarter 
Laute“ (Sonderegger 1959:1). Innerhalb dieser Definition des Umlauts im 
weitesten Sinne lassen sich aber auch Umlautdefinitionen im engeren 
und im engsten Sinne unterscheiden: je nachdem, ob nur regressive oder 
auch progressive Assimilation, nur partielle oder auch totale 
Assimilation, nur Fern- oder auch Kontaktassimilation zum Umlaut 
gerechnet werden und ob nur solcher Lautwandel als Umlaut bezeichnet 
wird, der von i oder j ausgeht, oder auch Lautwandel, der von anderen 
Vokalen, eventuell auch von palatalen Konsonanten oder gar von 
beliebigen Konsonanten ausgeht. 


(26) Klassifikation der Umlautbegriffe nach Sonderegger (1959:2-3) 


Umlaut im 


weitesten engeren Sinn engsten 


Sinn Sinn 


a) |b) | © | d) | a) |b) 


. progressiv 

Richtung - 
regressiv + + 
partiell ? |? 

Umfang 
total ? |? 
Vokalen 

ausgehend |iundj + 


von Konsonanten 


palatalen Kons. 


Fernassimilation + 
Stellung Pee 
Kontaktassimilation 
+ = Definition schließt diese Eigenschaft ein 


Definition schließt diese Eigenschaft aus 
keine Angaben bei Sonderegger (1959) 


~ 
ll 


Nach der weitesten Auffassung (vertreten von Noreen 1903; Kock 1889, 
1911-1916) sind alle auf einen Vokal gerichteten Assimilationsprozesse 
Umlaut. Demnach miissen unter anderem folgende Prozesse als Umlaut 
im weitesten Sinn gelten: Senkung von germ. i zu ahd. e sowie germ. u zu 
ahd. o vor a e, o (außer bei nachfolgender Nasal+ Konsonant- 
Verbindung), Brechung im Altenglischen von i zu io/eo, e zu eo, œ zu ea 
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vor nachfolgendem r+ Konsonant, l+ Konsonant oder velarem Frikativ, 

Metaphonie in romanischen Sprachen, aber auch verschiedenste Typen 

von Vokalharmonie im Tiirkischen, Finnischen, Ungarischen und 

zahlreichen außereuropäischen Sprachen, bei denen sich die Qualität des 

Suffixvokals systematisch nach der Qualität des vorangehenden 

Stammvokals richtet (wobei letzteres gerade das Gegenteil von i-Umlaut 

im Althochdeutschen ist). Im engsten Sinn dagegen umfasst der Umlaut 

nur all diejenigen Fälle, bei denen ein Vokal an ein nachfolgendes i oder j 

in Distanzstellung, d.h. nicht innerhalb eines Diphthongs, assimiliert 

wird. Nicht unter Umlaut im engsten Sinne würden demnach fallen: 

e die Entwicklung von germ. ai zu ahd. ei (da es sich um Kontakt- und 
nicht um Fernassimilation handelt), 

e der im Germanischen anzutreffende a-Umlaut, d.h. die Senkung 
hoher Vokale vor nachfolgenden unbetonten a, o und e (da nicht i 
und j Auslöser des Prozesses sind), 

e die Hebung von germ. e zu ahd. i vor nachfolgenden i, j, u sowie 
Nasal + Konsonant-Verbindungen (da auch u und Konsonanten- 
verbindungen den Lautwandel bedingen), 

e u-Umlaut von altnord. a zu o in den altnordischen Dialekten (da hier 
u bzw. w Auslöser der Vokalassimlation sind). 

Neben dem Umlaut im weitesten Sinne und dem Umlaut im engsten 

Sinne unterscheidet Sonderegger noch vier weitere Definitionen für 

Umlaut im engeren Sinne, vgl. (26), auf die hier nicht weiter 

eingegangen wird. Es sei noch einmal darauf hingewiesen, dass die 

Gemeinsamkeit aller hier besprochenen Umlautdefinitionen darin 

besteht, dass das Ziel der Umlautung immer ein Vokal und niemals ein 

Konsonant” ist. 

In der vorliegenden Arbeit soll unter Umlaut eine progressive (nach 
links gerichtete) oder regressive (nach rechts gerichtete) partielle oder 


32 Bei Sonderegger (1959:2) scheint ein Druckfehler vorzuliegen bei der 
Formulierung zum Umlaut im engeren Sinne unter (2c): „c) regressive part. oder 
tot. Assimilationen von Vokalen und Konsonanten an Vokale in Fern- oder 
Kontaktstellung“. Richtig müsste es heißen: „auf Vokale in Fern- oder 
Kontaktstellung“. So lautet auch die Formulierung zum Umlaut im weiteren Sinn 
unter (1): „[...] Assimilationserscheinungen von Vokalen und Konsonanten auf 
Vokale in Fern- oder Kontaktstellung“ (Sonderegger 1959:2). 
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totale Assimilation eines Vokals an einen Vokal oder Halbvokal in Fern- 
oder Kontaktstellung verstanden werden. Nach Sonderegger (1959) fiele 
die hier angesetzte Umlautdefinition am ehesten unter den Umlaut im 
engeren Sinn (Spalte d in (26)). Als entscheidende Neuerung soll jedoch 
gelten, dass der den Umlaut auslösende Laut in einer schwachen Stellung 
steht, vgl. Schwächepositionen innerhalb einer Silbe unter (24). Die 
landläufige Angabe der Assimilationsrichtung als progressiv oder 
regressiv wird damit aufgegeben und ersetzt durch die 
stellungsabhängige Stärke oder Schwäche des Lautes, der den Umlaut 
auslöst. Mit Hilfe dieser Definition lassen sich zahlreiche Umlaute in den 
germanischen Tochtersprachen zusammenfassend behandeln. In den 
nachfolgenden Abschnitten werden die Bedingungen für Umlaute im 
Althochdeutschen bestimmt, und zwar für i-, u- und o-Umlaut. 


4. i-Umlaut im Althochdeutschen 


Am Anfang der Betrachtung steht der i-Umlaut im Althochdeutschen, der 
als der prototypische Fall eines Umlauts gelten kann. Zu unterscheiden 
sind die phonologischen Bedingungen für den Eintritt des Umlauts von 
den Bedingungen für verschiedene Ausprägungen des Umlauts, vor allem 
für den Umlaut von a. Darum werden im Folgenden die Regeln (27) und 
(28) unterschieden. 


(27) Phonologische Bedingungen für den i-Umlaut im Althochdeutschen 


Im Althochdeutschen tritt ein phonologisch bedingter Umlaut 
velarer Vokale (d.h. eine Palatalisierung) genau dann ein, wenn 


(27a) ein vokalisches oder konsonantisches i im selben 
prosodischen Wort mit einem ursprünglich velaren Vokal 
steht (Domänebedingung) und 


(27b) wenn dieser i-Laut weder als erster Laut im Anfangsrand 
noch im Nukleus einer betonten Silbe steht 
(Schwächebedingung). 


Regel (27) erfasst die Palatalisierung der velaren Vokale, die in einer 
umlautbewirkenden Umgebung stehen: u > ü, o > 6, a > dä. Noch nicht 
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beschrieben ist damit die meistens auftretende zusätzliche Hebung 
palataler Kurzvokale zu e. Die Bedingungen für diese Hebung werden in 
(28) genannt. 


(28) Phonologische Bedingungen für die Hebung nicht-hoher, palataler 
Kurzvokale vor i 


Für nicht-hohe, palatale Kurzvokale, die im selben prosodischen 
Fuß mit einem i stehen, dazu zählt germ. é und der nach Regel (27) 
eintretende Umlaut von a, gilt folgendes. 


(28a) In der Regel wird der Kurzvokal zu einem geschlossenen e 
gehoben (e-Default). 


(28b) Die Hebung zu e tritt nicht ein, (i) wenn die unmittelbar auf 
den Umlautvokal folgenden Konsonanten der Hebung zu 
kurzem, geschlossenem e entgegenstehen oder (ii) wenn der 
palatale Kurzvokal durch eine prosodische Wortgrenze vom 
i-Laut getrennt ist (Interferenzbedingung). 


Der e-Laut nach (28a) wird in den althochdeutschen Denkmälern meist 
mit einem e-Graph wiedergegeben. Für die Fälle mit Interferenz nach 
(28b) lässt sich erst in mittelhochdeutschen Texten ein Umlautgraphem 
(ä) nachweisen. In den althochdeutschen Denkmälern wird hier meist 
noch der Buchstabe (a), gelegentlich aber auch (e) geschrieben. Keinen 
orthographischen Niederschlag findet die Hebung von germ. e zu ahd. e. 
Die Reflexe im Althochdeutschen werden in beiden Fällen mit einem e- 
Graph wiedergegeben. 

Die Abtrennung der Hebungsregeln in (28) von den allgemeinen 
Umlautbedingungen in (27) dient zunächst der Beschreibung des 
sogenannten Sekundärumlauts. So wirkten bekanntermaßen eine Reihe 
von Konsonanten und Konsonantenverbindungen hebungshindernd, vor 
allem ht, hs auf dem gesamten hochdeutschen Gebiet sowie einfaches h 
im Oberdeutschen. Erst im Mittelhochdeutschen erscheint in diesen 
Fällen ein offener Umlautvokal dä, z.B. in mhd. mdhtec, wähset (ahd. 
mahtig, wahsit). Das Gleiche gilt für Fälle, in denen der Stammvokal a 
durch einen Kurzvokal vom i-Laut getrennt ist, etwa in ahd. magadi, 
mahalen (< germ. *mahaljan), farawen (< germ. *farwjan), die erst 
mittelhochdeutsch als mägede, mähelen, värwen erscheinen. 
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Auch prosodische Wortgrenzen interferieren mit dem Umlaut. Die i- 
haltigen Suffixe -lih, -nissi/-nissa/-nussi lösen im Althochdeutschen nie die 
Hebung zu e, sehr wohl aber Umlaut von a zu d aus; die Hebung 
unterbleibt in diesen Fallen auch dann, wenn das Suffix in der 
unmittelbar nachsten Silbe folgt (Braune & Reiffenstein 2004: §27, Anm. 
5; Paul 2007: §L16, Anm. 5 u. 6): mhd. schdntlich (ahd. scandlih), väterlich 
(ahd. faterlih).* In der vorliegenden Arbeit wird dies auf die prosodische 
Struktur zurtickgefiihrt. Das Adjektiv scandlih war urspriinglich ein 
Kompositum, bestand also aus zwei Lexemen und hatte daher die 
prosodische Struktur [[scand],, [lih],],. Als -lih zum Affix herabgestuft 
wurde, blieb es weiterhin ein eigenes prosodisches Wort. Da auch 
[scand],, weiterhin ein separates prosodisches Wort bildete, in welches 
das Suffix -lih nicht voll integriert wurde, trat eine prosodische 
Wortgrenze zwischen -lih und Basis, und die Hebung zu e unterblieb. Eine 
ausführlichere Darstellung der Verhältnisse folgt in Teil V.5 mit einer 
optimalitätstheoretischen Analyse der Prosodie im Althochdeutschen. 

Als palataler Kurzvokal ist laut (28) auch der éLaut im 
Althochdeutschen (aus germ. e bzw. aus lat. e in Lehnwörtern) ein 
Zielvokal für den Hebungsprozess. Er wird durch i-Laute gehoben, wenn 
er durch Formübertragung oder Entlehnung vor diesen zu stehen 
kommt,” wie etwa in ahd. welih ‘welch (Pronomen)’, ledig ‘ledig’, pelliz 
‘Pelz’ (< spätlat. pellicia), prediga ‘Predigt’ (< mittellat. predica).” Die 
genauen lautlichen Verhältnisse im Alt- und Mittelhochdeutschen lassen 
sich schwer und meist nur indirekt aufgrund der Reimverhältnisse in den 
Dialekten rekonstruieren, in denen die Reflexe von é und e einigermaßen 
durchgängig voneinander geschieden sind. Doch auch in diesen Dialekten 
hat analoger Ausgleich die Reflexe von é und e in zahlreichen modernen 
Wortformen oft schon verwischt. Gar nicht zu klären sein dürfte, ob auch 


33 Hierher gehört wohl auch das Ortsnamensuffix -inga, das aufgrund seines 
Nebenakzents lediglich Sekundärumlaut auslöst, vgl. die sehr frühen Belege 
Amfinga und Papinga für die bairischen Ortsnamen Ampfing und Pabing (anders 
Gütter 2003, für den die Belege das Ende der Primärumlautphase anzeigen). 

34 Denn sonst gilt: germ. ë > ahd. i vor i, j. 

35 Ausführliche Darlegungen und weitere Belege für die Hebung von é zu e in 
den Dialekten finden sich bei Paul (1887:548f.), Kauffmann (1888) und 
Kranzmayer (1938:84f.). 
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umgekehrt betonte i im Nukleus oder j im Silbenanfangsrand hebend auf 
nachfolgende e gewirkt haben. Weder der Reimgebrauch noch die 
Reflexe in den modernen Mundarten können darüber Auskunft geben. 

Obwohl die Beleglage für die Hebung von é zu e recht spärlich ist, 
sprechen dennoch einige Belege dafür, dass die Interferenzbedingung in 
(28b) nicht für die Hebung von germ. e und lat. e gilt. Insbesondere 
zeigen folgende Wörter im Bairischen Reflexe der Hebung zu e: ahd. 
pechari ‘Becher’, sehtari ‘Sechter (Gefäß)’, sehsiu ‘sechs’, zehniu ‘zehn’ (alle 
Beispiele aus Kranzmayer 1938:84). Weder die h-Verbindungen zwischen 
e und i noch die Mittelsilbenvokale in ahd. pechari, sehtari haben in 
diesen Fällen die Hebung zu e verhindert. Es scheint also im Vergleich 
zur Hebung des Umlauts von a zu e, dass die Hebung des ë zu e 
wesentlich konsistenter durchgeführt wurde. Eine mögliche Erklärung für 
dieses unterschiedliche Verhalten könnte sein, dass der offene 
Ursprungsvokal a selbst mehr Widerstand gegen eine Hebung ausübte als 
dies der halboffene Vokal é tat. Die Assimilation fiel bei der Hebung eines 
€ kleiner aus als bei der Hebung eines a. 

Da die Datenlage zum sogenannten Primärumlaut des a zu e im 
Althochdeutschen — jene Umlautfälle also, die unter die Regeln (27) und 
(28a) fallen, aber nicht die Interferenzbedingungen unter (28b) erfüllen 
— am klarsten ist, eignet sich dieser Umlaut am Besten als Beispiel für 
die folgenden, allgemeinen Ausführungen zum i-Umlaut im 
Althochdeutschen. Dies ist die Umlautausprägung, die schon sehr früh 
und in großer Stückzahl in den Dokumenten nachzuweisen ist. Die 
phonologischen Umlautbedingungen unter (27) werden also anhand von 
Beispielen mit Primärumlaut illustriert, die zusätzlich auch die 
Hebungsbedingungen unter (28) erfüllen. Für die übrigen Umlautvokale 
/a:, ø, yG)/, die von (28) nicht betroffen sind, gilt dann als Null- 
Hypothese die Annahme, dass sie sich parallel zum Primärumlaut 
entwickeln, d.h. dass Palatalisierung eintritt und nur die Hebung 
unterbleibt. 

Umlautbedingung (27a) charakterisiert die den Umlaut auslösenden i- 
Laute als vokalisch oder konsonantisch, d.h. i oder j. Zudem legt die 
Bedingung die Domäne des Umlauts auf das prosodische Wort fest. 
Dagegen ist die Domäne für die Hebung zu e auf den prosodischen Fuß 
beschränkt, vgl. (28). Letzteres macht einen wesentlichen Unterschied 
zur Vokalharmonie aus, bei der das ganze prosodische oder 
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morphologische Wort als Domäne gilt (wobei der Wirkungsbereich der 
Vokalharmonie durch opake Vokale eingeschränkt sein kann). Die 
althochdeutsche Hebung zu e wirkt aber niemals über den prosodischen 
Fuß hinaus. 

Einen interessanten Sonderfall stellen in diesem Zusammenhang die 
Enklitika bei Otfrid dar, die mit dem vorangehenden Wort einen 
prosodischen Fuß bilden. Das wird vor allem bei enklitischem ih sichtbar: 
ahd. meg ih, drenk ih für mag ih, drank ih (Braune & Reiffenstein 2004: 
826, Anm. 3). Zwar ist der Umlaut aufgrund eines enklitischen 
Personalpronomens im Althochdeutschen nur bei Otfrid anzutreffen, 
jedoch finden sich im Mittelhochdeutschen noch Relikte enklitischer 
Umlautung in sem mir ‘so mir’ (neben sam mir), dest (für daz ist) (Paul 
2007: 8 L 16, Anm. 4), was auf eine weitere Verbreitung des Phänomens 
hinweist, als es die wenigen althochdeutschen Belege zunächst vermuten 
lassen. Anscheinend bilden aber die Enklitika nur bei Otfrid einen 
prosodischen Fuß mit der vorangehenden Silbe. Daher hat nur er die 
Hebung zu e. In den übrigen Fällen wird man Senkundärumlaute 
annehmen dürfen, die innerhalb eines prosodischen Wortes auch durch 
Enklitika ausgelöst, aber erst im Mittelhochdeutschen markiert wurden. 

Umlautbedingung (27b) formuliert eine Einschränkung des Umlauts 
je nach Position des i-Lauts im Wort. In betonten Silben lösen i-Laute nur 
dann Umlaut aus, wenn sie postinitial (in Position K_,) oder im Endrand 
(in Position K,, oder K,,) stehen, etwa in Randposition von Diphthongen 
(germ. ai > ahd. ei). Sie dürfen jedoch nicht in silbeninitialer Position 
einer betonten Silbe stehen, vgl. (29a), und auch nicht direkt im Nukleus 
der betonten Silbe, vgl. (29b). 
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(29) Kein Umlaut durch i, j in Stärkeposition 


(29a) j in silbeninitialer Position der betonten Silbe 
ahd. ja ‘ja, nun’ > mhd. ja 


ahd. jagon ‘jagen, treiben’ > mhd. jagen 
ahd. jamar ‘Jammer, Betriibnis’ > mhd. jämer 
ahd. jar ‘Jahr’ > mhd. jar 
ahd. joh/juh ‘Joch’ > mhd. joch 
ahd. jugund ‘Jugend’ > mhd. jugent 
ahd. jung ‘jung, neu’ > mhd. junc 


(29b) iim Nukleus der betonten Silbe 
ahd. stimma ‘Stimme’ 
ahd. skimbal ‘Schimmel’ 
ahd. klingan ‘klingen’ 
ahd. fingar ‘Finger’ 


Keine Einschrankungen gelten fiir i-Laute in unbetonter Silbe, dort 
bewirken sie immer den Umlaut der velaren Vokale. Dies zeigt sich etwa 
bei den Verba pura, die schon vor dem Einsetzen der althochdeutschen 
Überlieferung in die Klasse der jan-Verben übergetreten waren: ahd. sdien 
> mhd. sejen ‘sahen’, ahd. bluoien > mhd. blüejen ‘blühen’. Das 
silbeninitiale j ist in diesen Fällen schwach positioniert, weil es in 
unbetonter Silbe steht. Insgesamt gilt also: Die i-Laute lösen nur dann 
Umlaut aus, wenn sie in einer Schwächeposition, vgl. (24), stehen. 

Eine Spezifikation der Direktionalität des Umlauts als regressiv ist 
überflüssig und irreführend, genauso wie die Angabe, dass der 
umgelautete Vokal betont zu sein habe. Der Nom. Pl. von ahd. gdst ‘Gast’ 
lautet nicht deshalb gésti, weil einst einem betonten a ein i folgte, 
sondern weil ein a zusammen mit einem unbetonten i im selben 
prosodischen Wort stand. Entscheidend ist nicht die Betontheit des a oder 
die Reihenfolge „a vor i“, sondern die Unbetontheit des i und die 


3% Den Umlaut löst das im Voralthochdeutschen von den jan-Verben 
übernommene j aus, das in den frühen Belegen meist gar nicht mehr steht. Die bei 
den Verba pura im Laufe des Althochdeutschen vermehrt geschriebenen -j- sind 
dagegen Hiatustilger (Braune & Reiffenstein 2004: §117 Anm. 1), mit denen der 
Umlaut nichts weiter zu tun hat. 
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gemeinsame Zugehörigkeit beider Laute zu einem prosodischen Wort. 
Diese Behauptung stützt sich auf folgende Beobachtungen. 


(30) Besondere Charakteristika des Umlauts 


(30a) Der i-Umlaut im Althochdeutschen verläuft sowohl regressiv 
(von rechts nach links) als auch progressiv (von links nach 
rechts). 


(30b) In betonter Silbe lösen i in Nukleusposition und j in 
silbeninitialer Position nicht Umlaut aus, weder bei betonten 
noch bei unbetonten Vokalen der Umgebung.” 


(30c) Auch unbetonte Vokale werden regelmäßig umgelautet. 


Behauptung (30a), dass die Assimilationsrichtung beim Umlaut nicht nur 
von rechts nach links, sondern auch umgekehrt von links nach rechts 
verlaufen kann, wird durch die Wirkung des konsonantischen i (=j) auf 
*a in unbetonter Silbe gestützt (Braune & Reiffenstein 2004: 858 Anm. 1 
sowie 8118 Anm. 2). Altes “ja erscheint im ältesten Althochdeutsch 
bereits meist als e. Der Lautwandel dürfte sich über einen Zwischenschritt 
*ja > *je > e vollzogen haben, indem das j hebend - und das heißt hier: 
umlautend - auf das a wirkte. Würde man die alternative Entwicklung 
*ja > *a > e ansetzen, so bliebe die Hebung des *a zu e unerklärlich.”* 
Betroffen von dem Wandel vorahd. *ja > ahd. e sind eine ganze 
Reihe morphologischer Klassen: die ja-Stämme der Substantive (Braune & 
Reiffenstein 2004: 8198 Anm. 4) und der Adjektive (8250 Anm. 2, 8256 
Anm. 1), die j-Bildungen der n-Deklination (8226 Anm. 1), die schwachen 
Verben Klasse I (88305-316, 88356-365) sowie die j-Präsentien (8327). 


37 Die wenigen Fälle, bei denen es denkbar wäre, dass eine Assimilation von 
der betonten Stammsilbe ausging, sind zahlenmäßig zu vernachlässigen. In Frage 
käme z.B. ahd. mittimen neben mittamen und mittemen im Tatian (Braune & 
Reiffenstein 2004:867). Jedoch werden diese Schreibschwankungen der 
Mittelsilbenvokale besser durch die Nebensilbenreduktion erklärt: (i), (a), (e) 
geben jeweils das reduzierte /a/ wieder, für das es keinen festen Buchstaben gab. 

38 Sofern einschlägige Belege ein a in den Flexionendungen zeigen, handelt es 
sich um spätere Formen, bei denen das a durch Analogie wieder eingetreten ist. 
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(31) Progressiver Umlaut germ. *ja > frühahd. e 


(31a) substantivische ja-/jo-Stamme 
Nom./Akk. Pl.: frühahd. arslahare ‘Farber’, lérare ‘Lehrer’, 
sunte ‘Sünde’ 


(31b) adjektivische ja-/jö-Stämme 
Akk. Sg. mask.: frühahd. sniumen ‘schnell’, cafoaren ‘geeignet’ 
Akk. Sg. fem.: frühahd. framade ‘fremd’ 
Nom. Pl. mask.: frühahd. ursahtie ‘ungewiss’, redie ‘sicher’ 


(31c) adjektivische ja-Stämme, schwach flektiert 
Nom. Sg.: frühahd. mareo ‘bekannt’, luggeo ‘liignerisch’ 
Part. Präs.: frühahd. waldendeo, nerrendeo ‘ernährend’ 
Dat. Sg. fem.: frühahd. niuwiün ‘new’ 
Dat. Pl.: (un)festeöm ‘(un)befestigt’ 


(31d) Feminina der n-Deklination, sofern ursprünglich mit -j- 
gebildet” 
Nom. Sg.: frühahd. frauuue ‘Frau’, huore ‘Hure’, mucke 
‘Mücke’, zatare ‘Hure’ 


(31e) jan-Verben” 
Inf.: frühahd. suochen ‘suchen’, zellen ‘zählen’ 
Part. Präs.: frühahd. suochenti, zellenti*' 
3.Pl. Ind. Präs.: frühahd. suochent, zellent, nerient ‘nähren, 
schützen, heilen’ 


3 Bei den Maskulina der n-Deklination, von denen viele ursprünglich mit jan- 
gebildet waren, lässt sich der Wandel *ja > *je nicht belegen, da nur Reflexe von 
*j erhalten sind, *e aber bereits durch die Vokale der Flexionssuffixe verdrängt ist. 

“ In der Klasse II der schwachen Verben (-ön) lässt sich der Wandel *ja > *je 
bei jenen Verben nicht belegen, die von nominalen ja-Stämmen abgeleitet sind. In 
diesen Fällen sind nur Reflexe des *j erhalten, der zu erwartende Endungsvokal *e 
ist aber bereits durch die Vokale der Flexionssuffixe verdrängt. 

4 Umlaut kann auch durch das auslautende -i erklärt werden (germ. -anti > 
ahd. -enti), wie er ja auch im Part. Präs. der starken Verben auftritt. 
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(31f) j-Präsentien 
Inf.: frühahd. bitten ‘bitten’, liggen ‘liegen, sich befinden’, 
swerien ‘schwören’, scephen ‘schöpfen, bewirken’ 
Part. Präs.: frühahd. heffenti ‘hebend’ 
3.Pl. Ind. Präs.: frühahd. liggent, sitzent 


Meist wird der Umlaut ja > e ab dem 9. Jahrhundert wieder 
zurückgenommen, indem in Analogie zu anderen morphologischen 
Klassen a oder gar ia eintritt. Belegt sind zum Beispiel die ältesten 
Formen ahd. sunte ‘Sünde’ und kennen ‘kennen’ aus *suntja, *kannjan (s. 
Braune & Reiffenstein 2004: 8118, Anm. 2; Paul 1877:344f); zu 
rekonstruieren sind die Vorstufen *suntja, *kennjan. Im 8. und 9. 
Jahrhundert zeigen sich Tendenzen, das j und das a analog wieder 
herzustellen. So heißt es im 9. Jahrhundert suntea, suntia, sunta statt 
älterem sunte in Analogie zu den übrigen a-Stämmen, im Oberdeutschen 
chennan statt chennen in Analogie zur Flexion der starken Verben. Sowohl 
bei *suntja als auch bei *kannjan steht das j im Anfangsrand der zweiten 
Silbe und bewirkt den Umlaut des ihm nachfolgenden Vokals a. Es 
handelt sich um einen progressiven Umlaut, der zur gleichen Zeit eintritt, 
zu der auch die regressiven Umlaute von germ. *a zu ahd. e eintreten. 

Auch in der Flexion der jan-Verben erscheint der ursprüngliche 
Bindevokal a im Frühalthochdeutschen noch umgelautet, z.B. in der 3. 
Person Plural Indikativ Präsens (frühahd. *-jant > ahd. -ent). Dieser 
Umlaut wird aber teilweise schon im 9. Jahrhundert wieder 
zurückgenommen und es steht in einigen Dialektgebiet -ant, wo bei den 
jan-Verben lautgesetzlich -ent zu erwarten wäre (Braune & Reiffenstein 
2004: 8309). Ähnliches gilt für das Partizip Präsens der jan-Verben, deren 
Endungen zwischen lautgesetzlichem -enti und analogem -anti (nach den 
starken Verben) schwanken (Braune & Reiffenstein 2004: 8316). Die ja- 
Stämme der Substantive wurden ab dem 9. Jahrhundert zunehmend 
analog zu den a-Stämmen flektiert, so dass die Endung -a älteres -e 
wieder verdrängte. Nur in den ältesten Quellen findet sich bei den 
Feminina der n-Deklination, die ursprünglich mit j gebildet waren, im 
Nominativ Singular die Flexionsendung -e, später tritt auch hier -a analog 
zu den übrigen femininen n-Stämmen ein. 

Aus dem Charakteristikum (30b), dass j und i keinen Umlaut 
auslösen, wenn sie in betonter Silbe stehen, erklärt sich der bisher 
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verbreitete Eindruck, dass der i-Umlaut eine gerichtete, regressive 
Assimilation von rechts nach links sei. Dieser falsche Eindruck ist der 
metrischen Struktur des Althochdeutschen geschuldet: Ein unbetonter 
Vokal steht niemals in der linken Silbe des Fußes, sondern in der 
mittleren oder rechten Silbe; umgekehrt steht der betonte Vokal niemals 
in der mittleren oder rechten Silbe des Fußes, sondern stets links, am 
Anfang des prosodischen Fußes. Da nun die Unbetontheit des i eine 
wesentliche Bedingung für den Umlaut ist, muss ein umlautauslösendes i 
immer rechts eines betonten Vokals stehen. In der Letztsilbe kann dieses i 
ein vorangehendes (stets unbetontes) a voll assimilieren zu i; es kann 
aber auch ein (stets betontes) a in der Erstsilbe umlauten zu ä.4? 

Eine Ausnahme ist bei i in der Mittelsilbe zu beachten. In dieser 
Stellung kann i zwar vorangehende (stets betonte) a umlauten zu e, 
jedoch meist nicht nachfolgende (unbetonte) Endsilbenvokale, unter 
denen besonders a und o sehr stabil sind. Diese Besonderheit ergibt sich 
zum einen aus der funktionalen Bedeutung der Endsilbenvokale als 
distinktive Bestandteile der Flexionsmarkierung. Andererseits ist zu 
beachten, dass die Endsilbenvokale ebenfalls unbetont sind und daher 
ihrerseits das Potential besitzen, den Umlaut auszulösen: So hatten 
beispielsweise unbetontes a, e, o bereits im Germanischen die Senkung 
von i und u zu e und o bewirkt, sofern die Vokale gemeinsam in einem 
Fuß standen. Jeder der beiden Faktoren für sich würde die 
Umlautresistenz der Endsilbenvokale bereits hinreichend erklären. 
Zudem verfallen ab dem Ende des 9. Jahrhunderts die Endsilbenvokale 
zusehends, so dass die Frage nach Umlautvokalen in Endsilben ab dem 
10. Jahrhundert aufgrund der undeutlichen Datenlage ohnehin nicht 
mehr zu beantworten ist. 


#2 Dieses ä wird in den althochdeutschen Texten orthographisch noch nicht 
von a unterschieden, sondern beide werden durch (a) wiedergegeben. Erst im 
Mittelhochdeutschen entwickelt sich ein Graphem (ä) und zwar mit großer 
Zuverlässigkeit dort, wo früher einmal dCi vorlag. Dies wird als Sekundärumlaut 
bezeichnet, und einige Forscher unterstellen, dass dieser Sekundärumlaut a > ä 
deutlich später als der Primärumlaut a > e eintrat. Auf diese Weise bleibt jedoch 
unerklarlich, weshalb der Sekundärumlaut ausgerechnet in einstiger 
Umlautumgebung geballt auftritt. 


110 


Vollig regular entwickelt sich der Diphthong germ. ai in betonter 
Silbe. Im Nukleus der Silbe steht der Vokal a (der Kernvokal), es folgt 
unmittelbar, jedoch bereits zum Silbenrand zählend, das i (der 
Randvokal). Sowohl die Schwächebedingung als auch die 
Domänebedingung für den i-Umlaut sind damit erfüllt. Nach (27) tritt 
also der i-Umlaut im Althochdeutschen ein, und so heißt es ahd. teil (got. 
dails), (h)leib ‘Brot’ (got. hlaifs), stein, skeidan ‘scheiden’ usw. Vor den 
Konsonanten r, w und germ. h tritt aufgrund ihrer senkenden Wirkung 
auf i *° zusätzlich Monophthongierung ein: germ. *ai > ahd. ee (=ë) vor 
r, w und germ. h. Gleiches gilt fiir ai auch in auslautenden, unbetonten 
Silben, wo ebenfalls regelmäßig germ. *ai > ahd. ee (=@) gilt, z.B. die 
Flexionsendung im Opt. Prat. -€ (< germ. *-ai) der starken und 
schwachen Verben.** 

Dass, wie unter (30c) behauptet, auch unbetonte Vokale umgelautet 
werden, beweisen jan-Verben auf -azzen (< germ. *-atjan). 


(32) Umlaut des unbetonten a bei Bildungen auf -azzen 


(32a) a > ein der St. Galler Handschrift des Abrogans: leidezzit 
‘verdammt’, irrofezit ‘verkündet’, heilezet ‘grüßt’ 


(32b) a > iund analog eingetretenes -ant im Zweiten Reichenauer 
Glossar: lichizzant ‘heucheln (3.Pl. Pras. Ind.)’ 


Der Umlaut von a zu e durch folgendes i, j tritt in unbetonter Silbe auch 
bei den Bildungen auf -ari ein. Es ist anzunehmen, dass ursprüngliches 
-ari zunächst gekürzt wurde zu -ari und dann Umlaut zu -eri erfuhr. 


# vgl. dazu Vennemann (1972b) 

# Bei den schwachen Verben der Klassen II und III zeigt sich -é als Reflex von - 
ai nur in den längeren Flexionsformen (ahd. salböe, habee), nicht in den kürzeren 
(ahd. salbo, habe), vgl. Braune (2004: 8310). 
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(33) Umlaut von -ari > -eri/-iri 
(33a) mit partieller Assimilation a > e 
Isidor: sangheri ‘(Vor-)Sänger’ 


Tatian: beteri ‘Beter’, buohheri (neben buohhari) 
‘Schriftgelehrter, Schreiber’, landeri ‘Räuber’ 


Otfrid: driageri (neben driagari) ‘Heuchler’ 
(33b) mit totaler Assimilationa >i 


Otfrid: leitiri ‘Anführer’, fariri (neben farari) ‘Verfolger, 
Versucher’ 


Wahrscheinlich geht auch die Endung -enti der starken Verben im 
Partizip Präsens auf i-Umlaut zurück, wenngleich analoger Ausgleich 
nach dem Partizip Präsens der schwachen Verben (-enti < *-janti) 
ebenfalls denkbar ist, bei denen das e aus *ja entstanden ist. 


5. u-Umlaut im Althochdeutschen 


Einen später auftretenden, komplexeren Fall von Umlaut stellt die 
Monophthongierung von ahd. iu zu mhd. ü dar. Der Wandel von germ. eo 
zu ahd. iu trat nur dort ein, wo nicht ein folgendes unbetontes a, e, o die 
Senkung von eu zu eo bewirkt hatte, d.h. ahd. iu steht nur vor i (j), u der 
Folgesilbe. Erste Anzeichen für die Monophthongierung von iu zu ü 
finden sich in der Schreibung (u) für /iu/ im 8. und 9. Jahrhundert. 
Braune (2004: 849 Anm. 1) führt zuhit, irzuhit (Tatian), scuhenti, turidu 
(Keronisches und erstes Reichenauer Glossar), fluc (Lorscher 
Bienensegen) als mögliche, frühe Belege an. Doch erst nach dem 10. 
Jahrhundert nimmt die Anzahl der u/ü-Schreibungen für /iu/ signifikant 
zu. 

Da ahd. iu auch vor nachfolgendem u zu mhd. ü monophthongiert 
wurde, kann der Wandel von iu zu ü nicht einfach ein regressiver i- 
Umlaut aufgrund des Vokals in der Folgesilbe sein, sondern es muss sich 
um eine Umlautung innerhalb des Diphthongs handeln. Verschiedene 
Varianten der Umlautung sind denkbar: Einerseits könnte das i in iu 
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palatalisierend auf das u gewirkt haben, so dass u zu ii wurde, 
andererseits könnte umgekehrt auch das u labialisierend auf das 
vorangehende i des Diphthongs gewirkt haben, so dass i zu ü wurde, 
schließlich könnten auch beide Assimilationsprozesse parallel oder 
zeitlich versetzt stattgefunden haben. Während die Labialisierung des i zu 
ü einen regressiven u-Umlaut darstellt, würde es sich bei der 
Palatalisierung des u zu ü um progressiven i-Umlaut handeln. Welchem 
Ansatz sollte nun der Vorzug gegeben werden? 

Um diese Frage im Sinne der hier vorgelegten Umlautdefinition zu 
entscheiden, ist es nötig festzustellen, welcher der beiden Diphthongteile 
als Kernvokal und welcher als Randvokal fungiert. Ein i-Umlaut könnte 
eintreten, wenn das u der Kernvokal des Diphthongs und das i Randvokal 
des Diphthongs ist, wenn also u im Nukleus der Silbe steht und i in 
postinitialer Stellung K_. Da die postinitiale Stellung eine 
Schwächeposition nach (24) ist, wäre die Schwächebedingung für i- 
Umlaut erfüllt. Umgekehrt müsste ein u-Umlaut eintreten, wenn i im 
Nukleus der Silbe steht und u in postnuklearer Stellung K,,. Damit wäre 
die Schwächebedingung für einen u-Umlaut erfüllt, da auch die 
postnukleare Stellung K,, eine Schwächestellung nach (24) ist. 

Für die Antwort ist nun entscheidend, dass es sich bei germ. *eu um 
einen fallenden Diphthong gehandelt haben muss, da bei schließenden 
Diphthongen der offenere Vokal immer Kernvokal, der geschlossenere 
Vokal immer Randvokal ist.” Setzt man für die Reflexe des Diphthongs 
*eu ebenfalls fallende Diphthonge an, so kann die Monophthongierung iu 
> ü elegant in eine allgemeine Umlauttypologie eingebunden werden: 
Im Diphthong iu steht das u in der Schwächeposition, das i im Nukleus. 
Wie bei allen übrigen Umlautungen auch wirkt hier der schwächere auf 
den stärkeren Vokal. Die Monophthongierung iu > ü kann also als u- 
Umlaut auf i erklärt werden. Das u in Schwächeposition bewirkt die 
Rundung des i in Nukleusposition, welches zu ü assimiliert wird. Mithin 
gilt: ahd. iu > üu. Die phonologischen Bedingungen für diesen u-Umlaut 
sind in (34) formal festgehalten. Zu beachten ist die formale Parallelität 
zu den Bedingungen für i-Umlaut in (27), mit dem Unterschied, dass die 
Domänebedingung beim u-Umlaut enger, nämlich auf eine Silbe 
festgelegt ist. 


4 Mit anderen Worten: Es gibt keine schließenden steigenden Diphthonge. 
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(34) Phonologische Bedingungen fiir den u-Umlaut im Althochdeutschen 


Im Althochdeutschen tritt ein phonologisch bedingter u-Umlaut 
(d.h. eine Labialisierung) genau dann ein, 


(34a) wenn ein vokalisches oder konsonantisches u in derselben 
Silbe mit einem ursprünglich ungerundeten Vokal steht 
(Domänebedingung) und 


(34b) wenn der u-Laut nicht im Anfangsrand oder Nukleus einer 
betonten Silbe steht (Schwächebedingung). 


Der Diphthong germ. au genügt ebenfalls den Bedingungen (34a) und 
(34b). Entsprechend verändert auch er seine Lautform im 
Althochdeutschen. Ab dem 9.Jahrhundert wirkt der Randvokal u 
(= Schwächeposition) rundend auf den Kernvokal a, so dass germ. au als 
ahd. ou erscheint: ahd. houbit (got. haubip), gilouben (got. galaubjan), 
loufan (got. hlaupan), ouga (got. augö), ouch (got. auk). 

Aus lauthistorischen Gründen kommen konsonantische u 
(=Halbvokale w) im Althochdeutschen nur im Anfangsrand vor. Im 
Silbenendrand war w zum Vokal o (selten u) geworden oder ganz 
ausgefallen (Braune & Reiffenstein 2004: §§108-110), im Silbenkern war 
immer nur vokalisches u möglich. Da konsonantisches u in silbeninitialer 
Position die Schwächebedingung (34b) nicht erfüllt, löst es auch nicht u- 
Umlaut bei gleichsilbigen Vokalen aus. Dies beweisen zum Beispiel ahd. 
wahsan ‘wachsen’ (nicht: *wohsan mit u-Umlaut a>o), ahd. werk ‘Werk, 
Tat’ (nicht: *work [werk] > mhd. *wörk mit u-Umlaut e>ö), ahd. wini 
‘Freund’ (nicht: *wuni [wyni] > mhd. wiini), ahd. ouwa ‘Aue’ (nicht: 
*ouwo mit u-Umlaut a> 0). 

Eine wichtige Ausnahme gibt es allerdings, nämlich geminiertes w 
nach germanischen Kurzvokalen (Braune & Reiffenstein 2004: 88111- 
114, 830 Anm. 2, $49 Anm. 4). In dieser Gelenkstellung steht der erste 
Teil des Halbvokals im Endrand, der zweite Teil im Anfangsrand einer 
Silbe. Und tatsächlich löst der Teil des geminierten w im Endrand einen 
u-Umlaut aus. Lautgeschichtlich zu unterscheiden sind vier Fälle: (1.) 
gemeingermanisches ww, (2.) einfaches germ. w mit westgermanischer j- 
Gemination, (3.) nach germ. a, (4.) nach germ. ë, i.“° 


4 Germ. u (ahd. o, u) ist bereits gerundet und unterliegt keinem u-Umlaut. 
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(35) Umlaut im Althochdeutschen durch ww-Geminaten 


nach germ. a nach germ. ë, i 
gemeingerm. | aww > auw > ouw iww > iuw (=tw) 
ww im Auslaut: au > ou éww > iww > iuw (=üw) 
westgerm. awj > aww > auw > ouw | iwj > iww > iuw (=üw) 
w+j im Auslaut: ao > ö ewj > iww > iuw (=üw) 


Wie in (35) zu sehen ist, sind im Althochdeutschen das 
gemeingermanische ww und das westgermanisch geminierte w nach 
germ. a und nach germ. ë, i zusammengefallen, solange sie nicht in den 
Auslaut traten. Für die folgende Betrachtung muss darum in den meisten 
Fällen nur nach dem der Geminate vorausgehenden Vokal unterschieden 
werden, nicht nach der lautgeschichtlichen Herkunft der ww-Geminate. 

Nach germ. a steht der erste Teil der Geminate ww im Silbenendrand 
und wird vokalisiert. Es entwickelt sich zunächst ein Diphthong au. Ab 
dem 9. Jahrhundert bewirkt der Randvokal u (in Schwächeposition) die 
Rundung des Kernvokals a zu o, so dass au in ou übergeht. Beispiele mit 
gemeingermanischer Geminate sind ahd. hauwan, houwan ‘hauen’, 
scauwön, scouwön ‘schauen’, glauwer, glouwer ‘klug’; für das durch j 
geminierte germ. w siehe die Formen ahd. gauwes, gouwes ‘Gau (Gen.)’, 
hauwes, houwes ‘Heu, Gras (Gen.)’, frauwa, frouwa ‘Frau’ (< *frawjo-), 
swV. I Inf. frauwen, frouwen (< germ. *frawjan) ‘freuen’, auwia, ouwa 
(<germ. *awjö-) ‘Aue’. 

Der u-Umlaut vollzieht sich auch dann, wenn die Geminate in den 
Wortauslaut tritt und nur ein w im Endrand stehen bleibt, während das 
zweite w ausfällt. Für das gemeingermanische ww im Auslaut findet sich 
bereits in frühester althochdeutscher Zeit ein Diphthong au, der genauso 
wie germ. au im 9. Jahrhundert zu ou umgelautet wird. Es heißt also 
ahd. glou ‘klug’, tou ‘Tau’, blou ‘schlagen, bläuen (Prät.)’ (zu bliuwan), rou 
‘bereuen (Prät.)’ (zu riuwan) mit Diphthong ou im Wortauslaut, vgl. 
Braune & Reiffenstein (2004: 8113). 

Was die Geminate ww nach germ. &, i angeht, vgl. die rechte Spalte in 
(35), so entwickelt sich dort ganz regulär die Monophtongierung von iu 


# Alemannische und fränkische Formen haben meist Umlaut des a zu e durch 
das nachfolgende j, also ahd. gewes, hewes, frewen etc. 
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zu [y:], die bereits weiter oben als Instanz des u-Umlauts behandelt 
wurde und hier nicht noch einmal besprochen werden muss. 


6. ahd. ao > 6 als o-Umlaut 


Anders als die im vorangegangenen Abschnitt besprochene Verbindung 
germ. aww verhält sich germ. a vor einfachem germ. w im Auslaut. Hier 
zeigen die althochdeutschen Denkmäler zunächst einen Diphthong ao, da 
germ. w im Auslaut regulär zu o wird. Bald tritt jedoch 
Monophthongierung zu 6 ein, also ahd. frag > fro ‘froh’, rag > ro ‘roh’, 
strag > stro ‘Stroh’ (Braune & Reiffenstein 2004: 8114). Hier wirkt ahd. o 
in Schwächeposition assimilierend auf a. Die Assimilation a > o findet 
sich allerdings nur dann, wenn beide Vokale innerhalb einer Silbe stehen, 
also einen Diphthong bilden. Man kann diesen Lautwandel als o-Umlaut 
mit der Silbe als Wirkungsdomäne rekonstruieren. 

Gegen die Annahme eines o-Umlauts kann eingewandt werden, dass 
das o nur auf den nicht-hohen Vokal a wirkt. Der Diphthong ahd. eo (< 
germ. *eu vor a, e, 0) dagegen unterliegt keinem o-Umlaut, wird also 
nicht zu 0. Vielmehr entwickelt eo sich später zu io, ie. Der Vokal o im 
Diphthong eo hat also keine rundende Wirkung auf den Vokal e, sonst 
hätte die Entwicklung ahd. eo > 6 stattgefunden. Schließlich vollzieht 
sich zeitgleich der postulierte o-Umlaut bei ao > 0 im Auslaut. Worin 
bestand also der Unterschied zwischen eo und ao? 

Das Problem kann behoben werden, indem man den Diphthong eo 
mit Randvokal e und Kernvokal o rekonstruiert. Damit stünde das o nicht 
mehr in Schwächeposition und hätte daher keinen Umlaut ausgelöst. 
Störend an dieser Lösung ist nur, dass die beiden Vokale ihre Stellung als 
Kern- bzw. Randvokal im Mittelhochdeutschen getauscht haben müssen, 
denn aus mhd. ie wird mhd. *[ia] und nhd. [i:]. Die schwache Position ist 
also durch e bzw. a besetzt, die starke Position hat das i inne. Und auch 
bei dem ursprünglichen Diphthong germ. *eu handelt es sich um einen 
fallenden Diphthong. Diese Lösung wäre also alles andere als elegant. 

Interessant ist dagegen die Beobachtung, dass bei den Kurzvokalen 
der Umlaut von kurzem germ. o nur sehr selten eintrat, weil im 
Voralthochdeutschen kein kurzes o vor i, j in der Folgesilbe stehen 
konnte, da dieses vor i und j zu u gehoben wurde. Wenn bei späteren 
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Wortbildungsprodukten, z.B. Ableitungen auf -lin oder -lih, ein kurzes o 
vor i zu stehen kam, so wurde häufig der Umlautvokal /ø/ vermieden 
und auf /y/ ausgewichen. So wird der Plural zu ahd. loh ‘Loch’ neben 
lochir auch luhhir geschrieben, der Dativ Plural von ahd. abgot ‘Götze’ 
erscheint als abgutirun (Braune & Reiffenstein 2004: 832, Anm. 1). Die 
ohnehin schwache Vertretung von /ø/ wird also weiterhin dadurch 
vermindert, dass /6/ vor /i/ gelegentlich zu /y/ gehoben wird. Diese 
Vermeidung bzw. schwache Vertretung des [9]-Lautes wird auch bei der 
Entwicklung des Diphthongs eo eine Rolle gespielt haben. Denn eine 
Rundung des Kernvokals o in eo hätte zu *go geführt. Um dieses ø im 
Diphthong zu verhindern, trat kein Umlaut ein. 

Nun hätte zwar der [ø]-Laut auch verhindert werden können, indem 
eo zu oo gewandelt worden wäre, so wie ja auch ao zu og wurde. Doch 
war beim Diphthong eo (< germ. *eu) die Verhinderung eines Phonem- 
Zusammenfalls mit 0 (< germ. *au) wichtiger als beim nur allophonisch 
im Auslaut auftretenden Diphthong ao (< germ. *awj). Eventuell 
unterschieden sich auch die labialen Qualitäten der Randvokale in eo und 
ao aufgrund ihrer unterschiedlichen lautlichen Herkunft. So könnte das o 
in ao aufgrund seiner Herkunft aus dem Halbvokal w stärkere Rundung 
aufgewiesen haben als o in eo, das seine Labialität auf dem Weg zu 
Schwa schon früh eingebüßt haben wird. Für einen schwachen Grad an 
Labialität bei eo spricht auch, dass sich erste ie-Formen für eo bereits im 
8./9. Jahrhundert finden, vgl. Braune & Reiffenstein (2004: 848 Anm. 1). 

Zwei Gemeinsamkeiten des o-Umlauts mit den Regeln für u- und i- 
Umlaut lassen sich feststellen: 

(i) So, wie etwas schlecht ist an den althochdeutschen 
Strukturen aCi, oCi, uCi, iu, au etc. und diese abgeändert 
werden in eCi, öCi, üCi, ü, ou etc., so ist auch etwas schlecht 
an den althochdeutschen Strukturen ao und eo, und sie 
werden zu ö bzw. ie geändert. 

(ii) Wichtigste Gemeinsamkeit ist jedoch, dass an dem 
Lautwandel ein Vokal in Schwächeposition beteiligt ist. Die 
Schwächebedingung wird also in allen Fällen erfüllt. 


Nach diesen Vorbemerkungen können nun die Bedingungen für den o- 
Umlaut formuliert werden. 
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(36) Phonologische Bedingungen fiir den o-Umlaut im Althochdeutschen 


Im Althochdeutschen tritt ein phonologisch bedingter o-Umlaut 
(d.h. eine Labialisierung) genau dann ein, 


(36a) wenn ein o in derselben Silbe mit einem ursprünglich 
ungerundeten Vokal steht (Domänebedingung), und 


(36b) wenn der o-Laut nicht im Anfangsrand oder Nukleus einer 
betonten Silbe steht (Schwächebedingung). 


Vergleicht man nun die Bedingungen von u-Umlaut und o-Umlaut, so 
fällt die Parallelität zwischen den Formulierungen auf, nur dass das eine 
Mal von einem vokalischen oder konsonantischen u, das andere Mal 
einfach von o die Rede ist: 


u-Umlaut o-Umlaut 
Domäne- |ein vokalisches oder ein o steht in derselben Silbe 
bedingung | konsonantisches u steht in mit einem ursprünglich 
derselben Silbe mit einem ungerundeten Vokal, vgl. 


ursprünglich ungerundeten (36a) 
Vokal, vgl. (34a) 


Schwäche- | der u-Laut steht nicht im der o-Laut steht nicht im 

bedingung | Anfangsrand oder Nukleus Anfangsrand oder Nukleus 
einer betonten Silbe, vgl. einer betonten Silbe, vgl. 
(34b) (36b) 


Aus phonologischer Sicht muss es sich dann um ein und denselben 
Prozess handeln. Sowohl beim u-Umlaut als auch beim o-Umlaut wird die 
Labialität, d.h. die Lippenrundung, vom gerundeten Vokal in 
Schwächeposition auf den ungerundeten Vokal in Stärkeposition 
ausgedehnt. Beide Umlaute können zu einer Umlaut-Regel 
zusammengefasst werden. 
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(37) Phonologische Bedingungen für den u/o-Umlaut im 
Althochdeutschen 


Im Althochdeutschen tritt ein phonologisch bedingter u/o- 
Umlaut (d.h. eine Labialisierung) genau dann ein, 


(37a) wenn ein gerundeter Vokal oder Halbvokal in derselben 
Silbe mit einem ursprünglich ungerundeten Vokal steht 
(Domänebedingung), und 


(37b) wenn der gerundete Vokal oder Halbvokal nicht im 
Anfangsrand oder Nukleus einer betonten Silbe steht 
(Schwächebedingung). 


Dieser u/o-Umlaut muss bereits im Frühalthochdeutschen eingetreten 
sein, nämlich schon vor der Zeit, als die ersten orthographischen 
Anzeichen sowohl für die Monophthongierungen iu > ü und ao > ö, als 
auch für die Diphthongverengung au > ao erscheinen. 
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Teil V Optimalitatstheoretische Analyse des 
althochdeutschen i-Umlauts 


1. Aufbau von Teil V 


Teil V integriert die wichtigsten, bisher besprochenen Eigenschaften des 
Umlauts in einer optimalitätstheoretischen Analyse. Dazu werden in dem 
Abschnitt Grundkonzeption der Optimalitätstheorie zunächst die 
technischen Voraussetzungen der Optimalitätstheorie dargestellt. 
Erlautert werden die Konzepte der universalen, verletzbaren 
Beschränkung, der sprachspezifischen Beschränkungshierarchie, der 
optimalen Outputform sowie die Prinzipien der Inklusivität und 
Parallelität. 

Der Abschnitt Interaktion von Beschränkungen zeigt, wie phonologische 
Prozesse durch die Interaktion verletzbarer Beschränkungen in der 
Optimalitätstheorie abgebildet werden können. Neben dem typologischen 
Charakter der Optimalitätstheorie werden besonders das 
Interaktionsmuster Homogeneity of Target/Heterogeneity of Process und die 
Blockierung von Prozessen durch Markiertheits- oder 
Treuebeschränkungen besprochen. 

Der Abschnitt Agree-[F] und Ipent-[F] führt die beiden 
Beschränkungsfamilien ein, die zur Modellierung des althochdeutschen i- 
Umlauts verwendet werden. Die Markiertheitsbeschränkungen des Typs 
AGREE fordern die Übereinstimmung benachbarter Segmente hinsichtlich 
eines bestimmten phonologischen Merkmals [F]. Die gegenläufigen 
IDEnT-Beschränkungen verlangen dagegen die unveränderte Abbildung 
des Inputs im Output. 

Vor der Analyse des i-Umlauts im Rahmen der Optimalitätstheorie 
wird in einem Exkurs in Abschnitt 5 die Prosodie des Althochdeutschen 
dargelegt und durch die Interaktion von verschiedenen Beschränkungen 
des Typs ALIGN dargestellt. Auıcn-Beschränkungen fordern, dass 
Konstituentenränder sich decken, wie z.B. der linke Rand einer betonten 
Silbe mit dem linken Rand eines Fußes. Des Weiteren wird die 
Beschränkung FTBin-u, wonach alle Füße zweimorig sein sollen, zur 
Darstellung der Fußstruktur des Althochdeutschen angewandt. 
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Schließlich werden die Suffixe ahd. -lih und -nissi als Klasse-II-Affixe 
bestimmt, die sich durch besondere prosodische Eigenschaften von 
gewöhnlichen Klasse-I-Affixen unterscheiden. 

Die eigentliche Analyse des i-Umlauts im Althochdeutschen erfolgt in 
den Abschnitten 6 und 7. Dabei behandelt Abschnitt 6 zunächst die 
Palatalisierung velarer Vokale in Umlautumgebung und modelliert diese 
mit Hilfe der Beschränkung Acree-[hinten], laut der benachbarte 
Segmente innerhalb eines Wortes hinsichtlich ihres Wertes für das 
Merkmal [hinten] übereinstimmen müssen. Im Anschluss daran wird die 
Hebung des Kurzvokals a zu e durch die Beschränkung AGREE,,;[tief] 
dargestellt, die für jedes prosodische Wort fordert, dass benachbarte 
Segmente hinsichtlich ihres Wertes für das Merkmal [tief] 
übereinstimmen. 

In Abschnitt 7 wird gezeigt, dass die wesentlichen Ausnahmen beim 
Umlaut des a entweder auf prosodische Wortgrenzen bei den Affixen -lih 
und -nissi zurückzuführen sind oder durch die lokale Selbstkonjunktion 
der Treuebeschränkung IbEnT-[tief] erklärt werden können. Die lokale 
Selbstkonjunktion [IDENT-[tief] & IDENT-[tief]], verhindert, dass innerhalb 
eines Fußes der Merkmalswert für [tief] zweimal verändert wird. Daher 
unterbleibt die Hebung zu e beim zweimorigen Langvokal a (=[aa]), bei 
dreisilbigen Wörtern mit i in der letzten Silbe (ahd. magadin), in den 
Sequenzen aht und ahs, in denen das h als Hauchlaut und daher 
phonemisch als behauchter Vokal zu gelten hat (ahd. mahti = /maati/), 
vor den Konsonanten rund l in der Silbenkoda, deren 
Sekundärartikulation eine weitere Veränderung des Fußes in den 
oberdeutschen Dialekten erschwert (ahd. haltit = [halitit], warmit = 
[war"mit]). 


2. Grundkonzeption der Optimalitätstheorie 


Im Folgenden wird der althochdeutsche i-Umlaut im Rahmen der 
Optimalitätstheorie (Prince & Smolensky 1993, 2002, 2004) 
rekonstruiert. Die Optimalitätstheorie (engl. optimality theory, OT) basiert 
auf dem Prinzip des Vergleichens, und zwar werden verschiedene 
Output-Kandidaten für die Realisierung einer bestimmten Inputform 
hinsichtlich einer Hierarchie verletzbarer Beschränkungen (engl. 
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constraints) verglichen. Die Beschränkungen bewerten die Form der 
Kandidaten und ihr Verhältnis zum Input. Da die Beschränkungen zum 
Teil konfligierende Anforderungen an die Outputformen stellen, 
schneiden die einzelnen Kandidaten unterschiedlich gut oder schlecht 
hinsichtlich ihrer Beachtung der verschiedenen Beschränkungen ab. Im 
Vergleich zweier Kandidaten gilt derjenige als „harmonischer“, der die 
am höchsten in der Hierarchie rangierende Beschränkung, die die beiden 
Kandidaten unterschiedlich bewertet, besser erfüllt. Die tatsächliche 
Outputform, d.h. der harmonischste oder optimale Kandidat, ist diejenige 
Form, die sich im paarweisen Vergleich mit allen anderen 
konkurrierenden Formen als die harmonischere erweist. Da 
Beschränkungen verletzbar sind, missachtet auch die als optimal 
ausgezeichnete Outputform typischerweise einige der Beschränkungen, 
die einen niedrigeren Rang in der Hierarchie einnehmen. Der optimale 
Kandidat ist also nicht in jeder Hinsicht perfekt.** 

Im einfachsten Fall werden zwei Kandidaten von einer einzigen 
Beschränkung C bewertet. Derjenige Kandidat, der weniger Verletzungen 
von C verursacht, ist der optimale Kandidat. Gibt es mehr als eine 
Beschränkung, so wird beim Vergleich der verschiedenen Kandidaten die 
Rangfolge der Beschränkungen strikt beachtet. Der optimale Kandidat 
kann hinsichtlich mehrerer Beschränkungen, die unterhalb der 
entscheidenden Beschränkung rangieren, durchaus sehr viel schlechter 
abschneiden als die konkurrierenden Kandidatenformen. Wenn zum 
Beispiel Beschränkung C1 über den Beschränkungen C2 und C3 rangiert, 
d.h. C1 dominiert C2 und C3, dann kann die Outputform schlechter als 
die konkurrierenden Formen hinsichtlich C2 und C3 abschneiden, 
solange sie bei C1 besser abschneiden. Eine Bewertung der Kandidaten 
hinsichtlich ihres globalen Abschneidens bei allen Beschränkungen findet 
nicht statt (strictness of strict domination). 

Der Vergleich der Kandidaten wird in einem Tableau dargestellt, in 
dem der optimale Kandidat mit einem oder mehreren Konkurrenten 
hinsichtlich des Abschneidens bei zwei oder mehr Beschränkungen 
verglichen wird. Die Beschränkungen werden in der hierarchischen 


48 Die nachfolgende Darstellung der Optimalitätstheorie orientiert sich an 
McCarthy (2002), wo auch weiterführende Informationen und Literaturhinweise 
zum optimalitätstheoretischen Forschungsprogramm zu finden sind. 
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Reihenfolge von links nach rechts in den Spalten des Tableaus 
eingetragen, die Zeilen enthalten die verschiedenen Kandidaten, unter 
denen einer der optimale ist. In die einzelnen Zellen werden die 
Verletzungen, die ein Kandidat hinsichtlich der im Spaltenkopf 
genannten Beschränkung verursacht, mit einem Asterisk ‘*’ als 
Verletzungsmarkierung gekennzeichnet. Der optimale Kandidat wird mit 
dem Symbol ‘=’ hervorgehoben. Das Tableau bildet ab, inwiefern ein 
Kandidat optimal hinsichtlich der Beschränkungen und ihrer Rangfolge 
untereinander ist. 


(38) Struktur eines Rangfolgearguments für die Beschränkungen C1 und 
C2 


Cl C2 


a.” Kandop = 


b. Kand = 


Komp 


Im Tableau (38) bewerten die Beschränkungen C1 und C2 die beiden 
Kandidaten unterschiedlich. C1 präferiert den optimalen Kandidaten 
Kandop» C2 präferiert den Konkurrenten Kand,om,. Da Kando, die 
tatsächlich auftretende Outputform ist, wird der Konflikt zwischen den 
Beschränkungen Cl und C2 gelöst, indem Ci in der 
Beschränkungshierarchie ein höherer Rang zugewiesen wird als C2, das 
heißt C1 dominiert C2 (abgekürzt geschrieben: [C1 > C2]). Die 
Konstellation in Tableau (38) ist eine notwendige Bedingung für ein 
Rangfolgeargument. Die Rangfolge ist aber nur dann hinreichend 
bewiesen, wenn es keine Beschränkung C3 gibt, die höher als C2 rangiert 
und genauso wie C1 den Kandidaten Kando, präferieren würde. In 
diesem Fall könnte nämlich nicht entschieden werden, ob C1 oder C3 für 
den Sieg des optimalen Kandidaten verantwortlich wäre. 

In den Tableaus unter (39) tritt kein Konflikt zwischen den 
Beschränkungen Cl und C2 auf. Daher lassen sich auch keine 
Schlussfolgerungen auf die relative Rangfolge der Beschränkungen 
ziehen. Kando» würde auch bei vertauschter Reihenfolge der 
Beschränkungen gewinnen. 


124 


(39) Beschränkungen, deren relative Rangfolge nicht erwiesen ist 


(39a) Gleiche Bewertung der Kandidaten durch C1 und C2 


Cl C2 


a.= Kandopı 


b. Kand x 


Komp 


(39b) Die Kandidaten werden durch C1 nicht unterschieden, 
weil beide C1 erfüllen 


Cl C2 


a.”  Kandop 


b. Kand 


Komp 


(39c) Die Kandidaten werden durch C1 nicht unterschieden, 
weil beide C1 verletzen 


C2 


a.= Kandopı 


b. Kand * 


Komp 


In den Tableaus unter (39) zeigt die gepunktete Linie zwischen den 
letzten beiden Spalten an, dass die Dominanz der einen Beschränkung 
über die jeweils andere Beschränkung nicht bewiesen ist. In Tableau 
(39a) eliminieren beide Beschränkungen den Kandidaten Kandkomp, in 
Tableau (39b) bewertet C, beide Kandidaten als gleich gut, in Tableau 
(39c) als gleich schlecht. 

Unter folgenden Umständen kann eine Beschränkung mehr als nur 
eine Verletzungsmarkierung für einen Kandidaten bewirken: Entweder 
verletzen mehrere Stellen des bewerteten Kandidaten die Beschränkung 
(verbietet eine Beschränkung z.B. Epenthesen, so wird sie von einem 
Kandidaten, in dem zwei epenthetische Laute vorkommen, zweimal 
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verletzt) oder die Kandidaten werden je nach graduellem Ausmaf der 
Beschrankungsverletzung bewertet (fordert die Beschrankung z.B. einen 
möglichst sonoren Silbennukleus, so erhält der Nukleus [a] eine 
Verletzungsmarkierung, die Nuklei [e] oder [o] zwei, die Nuklei [i] oder 
[ul drei, der Nukleus [r] vier Verletzungsmarkierungen etc.). Auf welche 
der beiden Weisen die mehrfachen Verletzungen einer Beschränkung 
zustande kommen, spielt für die weitere Bewertung der Kandidaten keine 
Rolle mehr. Die Verletzungsmarkierungen eines Kandidaten werden alle 
gleich gewichtet und behandelt. Beim Vergleich der konkurrierenden 
Outputkandidaten ist allein entscheidend, wie viele 
Verletzungsmarkierungen einem Kandidaten durch die Beschränkung 
zugewiesen werden. Es ist daher nicht nötig, die einzelnen 
Verletzungsmarkierungen abzuzählen. Wenn in einem Tableau genau 
zwei Kandidaten verglichen werden, dann (und nur dann) können jene 
Verletzungsmarkierungen, die die beiden Kandidaten gemeinsam haben, 
ignoriert bzw. gestrichen werden (engl. mark cancellation). In Tableau 
(39c) ist für beide Kandidaten ein Verletzungszeichen in der Spalte C1 
eingetragen. Diese gemeinsame Markierung kann gelöscht werden, so 
dass Tableau (39c) auf Tableau (39b) reduziert wird. Auf diese Weise 
wird zudem ersichtlich, dass C1 nichts zur Wahl des optimalen 
Kandidaten beiträgt. Die Methode der Markierungslöschung kann auch 
bei mehrfacher Verletzung einer Beschränkung durch einen Kandidaten 
angewandt werden. Wenn ein Kandidat z.B. drei 
Verletzungsmarkierungen aufweist und ein anderer fünf, so wird durch 
die Löschung die Anzahl der Markierungen auf null bzw. zwei reduziert. 
Entscheidend ist allein der relative Vergleich, nicht die absolute Anzahl 
der Verletzungsmarkierungen. 

Die spezifische Reihenfolge der Beschränkungen bildet die Grammatik 
einer Sprache im Sinne der Optimalitätstheorie ab. Die unterschiedlichen 
Grammatiken der verschiedenen Sprachen schlagen sich allein in der 
sprachspezifischen Rangfolge der Beschränkungen nieder. Es wird 
angenommen, dass die Beschränkungen einer Sprache alle in eine totale 
Ordnung zu bringen sind, auch wenn sich die Ordnungen in der Praxis 
nur partiell festlegen lassen. Die Dominanz von C1 über C2 lässt sich 
dabei auf zwei Wegen nachweisen: zum einen durch ein gültiges direktes 
Rangfolgeargument wie unter (38), zum anderen durch eine gültige 
Schlussfolgerung aus mehreren direkten Rangfolgeargumenten. Letztere 
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kann zum Beispiel auf der Transitivität der Dominanz-Relation beruhen: 
Wenn [C1 > C2] und [C2 > C3], dann auch [Cl > C3]. Falls für 
bestimmte Beschränkungen die hierarchische Rangfolge nicht 
nachweisbar ist, weil entsprechende Rangfolgeargumente fehlen, so 
können diese Beschränkungen nur in eine partielle Ordnung gebracht 
werden. 

Die grundlegenden Elemente der Optimalitätstheorie neben den 
Beschränkungen Con (=constraints) und der Beschränkungshierarchie H 
einer Sprache sind die Funktion EvAL und der Generator GEN. OT ruft die 
Funktion EvaL auf, um das harmonischste Mitglied einer 
Kandidatenmenge auszuwählen. Eval gibt die Kandidaten in einer 
partiellen Ordnung zurück, wobei das harmonischste Mitglied, die 
tatsächliche Outputform, an der Spitze steht. Entscheidend ist nur, 
welchen der Kandidaten EvAaL als optimal bewertet, alle suboptimalen 
Kandidaten und die Reihenfolge derselben untereinander ist in OT 
irrelevant. Alle Verliererformen sind gleich schlecht. 

Die Outputkandidaten werden von einem universellen Generator GEN 
generiert. GEN konstruiert mögliche Outputformen, wie zum Beispiel 
Wörter oder Sätze, und spezifiziert die Beziehungen zwischen ihnen und 
dem jeweiligen Input. Der Generator GEN ist universal, das heißt er 
produziert die Outputkandidaten für alle Sprachen der Welt. Die 
Kandidaten für einen gegebenen Input sind in allen Sprachen dieselben. 
GEN muss also eine solche Vielfalt an Kandidaten erzeugen, dass alle in 
den Sprachen der Welt möglichen Variationen abgedeckt werden. Diese 
Inklusivität, auch als Analysefreiheit (freedom of analysis) bezeichnet, 
verpflichtet dazu, alle nur irgend möglichen Abweichungen vom Input als 
potentiellen Output zu berücksichtigen. Gleichzeitig sind in GEN keine 
Beschränkungen hart einprogrammiert. Die Auswahl des richtigen 
Kandidaten obliegt allein der sprachspezifischen Rangfolge der 
Beschränkungen. Die klassischen Universalien und Typologien werden in 
OT durch das Zusammenspiel der verschiedenen Beschränkungen erklärt. 

Der Generator GEN ist inputabhängig. Die ausgegebenen Kandidaten 
sind auf die eine oder andere Weise mit der Information versehen, 
inwiefern sie vom Input abweichen, z.B. hinsichtlich der phonologischen 
Merkmalsspezifikation oder der morphosyntaktischen Struktur. Dies ist 
wichtig, damit spezielle Beschränkungen anschließend die 
Abbildungstreue des Outputs im Verhältnis zum Input bewerten können. 
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Die grundlegende Architektur der Optimalitätstheorie wird in (40) 
zusammengefasst. 


(40) Grundkonzeption der Optimalitätstheorie 


Input — | GEN |— Kandidaten — | EvAL | — Output 


GEN erhält einen Input und gibt eine Menge von Kandidaten aus. EVAL 
wendet die sprachspezifische Beschränkungshierarchie H auf diese 
Kandidatenmenge an und bestimmt den harmonischsten, d.h. optimalen, 
Kandidaten. Der optimale Kandidat bildet den Output. Dies kann eine 
phonologische Oberflächenform, eine syntaktische S-Struktur oder 
irgendein anderes linguistisches Objekt sein. Dabei gelten die unter (41) 
aufgeführten Prinzipien. 


(41) Prinzipien der Optimalitatstheorie*® 


(41a) Verletzbarkeit 
Beschränkungen sind verletzbar, aber die Verletzung durch 
den harmonischsten Kandidaten ist minimal. 


(41b) Rangfolge 
Beschränkungen haben eine sprachspezifische Rangfolge. 
Wann eine Verletzung minimal ist, wird durch diese 
Rangfolge festgelegt. 


(41c) Inklusivität 
Die Beschränkungshierarchie bewertet eine Menge von 
möglichen Outputkandidaten, deren Bandbreite nur durch 
allgemeingültige Strukturbedingungen eingegrenzt ist.” Es 
gibt keine besonderen Regeln oder Reparaturstrategien. 


4 nach McCarthy & Prince (2001:1f.) 

50 Solche allgemeingültigen Bedingungen fiir die Struktur können zum Beispiel 
sein: ‘Silben dominieren Moren (und nicht umgekehrt)’, ‘Füße dominieren Silben 
(und nicht umgekehrt)’, ‘Prosodische Wörter dominieren Füße und Silben (und 
nicht umgekehrt)”. 
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(41d) Parallelitat 
Welcher der verschiedenen Kandidaten die 
Beschränkungshierarchie am Besten erfüllt, wird anhand der 
gesamten Hierarchie und im Hinblick auf die gesamte 
Kandidatenmenge bewertet. Es gibt keine serielle Derivation. 


3. Interaktion von Beschränkungen 


In der Optimalitätstheorie sind alle Beschränkungen verletzbar. Jede 
beliebige OT-Beschränkung könnte in irgendeiner Sprache einen so 
niedrigen Rang haben, dass sie geradezu zwangsweise verletzt wird. Die 
Null-Hypothese dabei ist, dass alle Beschränkungen in den Grammatiken 
aller Sprachen präsent sind. Anders als Parameter, die entweder an- oder 
ausgeschaltet sind, präferieren Beschränkungen immer und unabhängig 
von ihrem hierarchischen Rang eine bestimmte Struktur des Outputs. Die 
Beschränkung ONSET etwa wird durch jede Silbe verletzt, die keinen 
Silbenanfangsrand hat, und zwar in jeder Sprache unabhängig davon, ob 
die in der Beschränkung ausgedrückte Präferenz für Silbenanfangsränder 
in der betreffenden Sprache sichtbar ist oder nicht. Das Sichtbarwerden 
des Wirkens von OnsET hängt von der sprachspezifischen Rangfolge aller 
Beschränkungen ab, und zwar ganz wesentlich davon, welche potentiell 
konfligierenden Beschränkungen ONsET dominieren. OT-Beschränkungen, 
die weder einen besonders hohen noch einen besonders niedrigen Rang 
haben, können mal aktiv sein und mal nicht, je nach Konfiguration der 
zu bewertenden Inputform. Sie sind partiell aktiv. 

Aus der Annahme universaler Beschränkungen und sprachspezifischer 
Rangfolgen ergibt sich eine Fakultätstypologie (engl. factorial typology).°' 
Jede Permutation der Beschränkungen aus Con in einer Hierarchie H 
stellt nach der Vorhersage der OT eine mögliche menschliche Sprache 
dar. Umgekehrt muss auch die Grammatik jeder menschlichen Sprache 
als eine der möglichen Permutationen abgebildet werden können. 
Andererseits gilt nicht, dass jede mögliche Permutation auch der 


51 Die Anzahl möglicher Permutationen in der Rangfolge der Beschränkungen 
ergibt sich aus der Fakultät der Anzahl der Beschränkungen, z.B. können fünf 
verschiedene Beschränkungen auf 5!=120 verschiedene Weisen geordnet werden. 
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Grammatik einer konkreten menschlichen Sprache entspricht. Aus der 
Fakultatstypologie folgen wichtige Implikationen fiir die Vorhersagen, 
die eine einzelne Beschränkung trifft. Jede vorgeschlagene Beschränkung 
muss dahingehend überprüft werden, welche typologischen 
Konsequenzen aus der Permutation der Beschränkungsrangfolge folgen. 
Die Phänomene einer Einzelsprache können daher nicht analysiert 
werden, ohne die sprachübergreifende Variation zu berücksichtigen. Die 
Optimalitätstheorie ist daher inhärent typologisch angelegt. 

Zwei grundlegende Typen von Beschränkungen werden in der 
Optimalitätstheorie unterschieden: Treuebeschränkungen und 
Markiertheitsbeschränkungen. Treuebeschränkungen verlangen die 
Übereinstimmungen zwischen Input- und Outputkandidaten und 
verwenden bei ihrer Bewertung dieser Abbildungstreue die von GEN 
mitgelieferten Informationen über die Abweichungen zwischen Inputform 
und Outputformen. Markiertheitsbeschränkungen bewerten die Form des 
Outputkandidaten und präferieren dabei bestimmte strukturelle 
Konfigurationen (z.B. Silben mit Anfangsrand gegenüber Silben ohne 
Anfangsrand oder Akkusativobjekte gegenüber Dativobjekten). Ohne 
Treuebeschränkungen würden so gut wie alle in den Inputformen 
spezifizierten Unterscheidungen verloren gehen und alle Inputformen 
würden auf die am Wenigsten markierte Outputform abgebildet. Ohne 
Markiertheitsbeschränkungen wiederum ließen sich die Unterschiede 
zwischen erlaubten und verbotenen Sprachstrukturen nicht systematisch 
darstellen. Die Begriffe „Treue“ und „Markiertheit“ sind dabei termini 
technici der Optimalitätstheorie. Insbesondere der Begriff der 
Markiertheitsbeschränkung darf nicht verwechselt werden mit dem 
Konzept der Markiertheit im Sinne der Prager Schule. 
Markiertheitsbeschränkungen bewerten einen Kandidaten allein aufgrund 
seiner Outputstruktur ohne auf die Ähnlichkeit des Kandidaten mit dem 
Input Bezug zu nehmen. Implikationsbeziehungen, die für Markiertheit 
im Sinne der Prager Schule wesentlich sind, folgen in der 
Optimalitätstheorie erst aus der Permutation der Beschränkungen in 
verschiedenen Rangfolgen. Auch muss der Begriff „Beschränkung“ oder 
„Constraint“ in der Optimalitätstheorie konzeptuell scharf abgegrenzt 
werden von den Begriffen „Beschränkung“ oder „Constraint“ in anderen 
Theorien. Die nicht verletzbaren Beschränkungen anderer Theorien 
können nicht einfach in die Optimalitätstheorie importiert werden, da 
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OT-Beschränkungen die Universalien der menschlichen Sprache nicht 
direkt ausdrücken. Universalien müssen in der Optimalitätstheorie aus 
der Interaktion verschiedener Beschränkungen abgeleitet werden. 
Außerdem darf eine Forderung, die eine OT-Beschränkung an Output- 
Kandidaten stellt, nicht mit qualifizierenden Einschränkungen definiert 
werden. Die eingeschränkte Aktivität einer OT-Beschränkung folgt 
systematisch daraus, dass sie von einer anderen OT-Beschränkung 
dominiert wird. Daher dürfen die Bedingungen für die Blockierung der 
Aktivität einer Beschränkung nicht bereits in die Formulierung der OT- 
Beschränkung aufgenommen werden. 

Die Interaktion verschiedener Beschränkungen ist die grundlegende 
Idee der Optimalitätstheorie. Der Einfachheit halber werden nicht immer 
alle Beschränkungen und ihre Interaktionen in einer Sprache gleichzeitig 
untersucht (obwohl alle Interaktionen parallel ablaufen), sondern es 
werden einzelne Beschränkungen für die Analyse ausgewählt. Betrachtet 
man zum Beispiel eine Markiertheitsbeschrankung M und eine 
Treuebeschränkung T, so sind zwei Rangfolgen denkbar: T kann M 
dominieren. Weil dann keine Verletzungen von T toleriert wird, muss der 
Outputkandidat den Input treu abbilden, auch wenn damit M verletzt 
wird. Oder M kann T dominieren. Dann werden Inputformen, deren 
Strukturen die Beschränkung M verletzen, auf untreue Outputformen 
abgebildet, die M erfüllen. 

Setzt man zu Illustrationszwecken für M eine ad hoc gebildete 
Markiertheitsbeschränkung UMLAUT ein, die den Umlaut des Stammvokals 
vor i oder j fordert, und für T eine Treuebeschrankung STAMMKOoNST, die 
gegen eine Veränderung des Stammes opponiert, so bilden Sprachen mit 
der Rangfolge [STAMMKonsT > UMLAUT] alle Kandidaten treu, d.h. ohne 
Umlaut, im Output ab (unter der Annahme, dass es keine weiteren 
relevanten Beschränkungen und Kandidaten gibt). 


(42) STAMMKONST > UMLAUT 


/gast+i/ STAMMKONST UMLAUT 
a.” gasti $ 
b. gesti * 
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Die realisierte Outputform gasti in Tableau (42) verletzt die 
Beschränkung UMLAUT, erfüllt aber die Treuebeschränkung STAMMKONST. 
Das Tableau hat die Struktur eines Rangfolgearguments, vgl. (38), das die 
Dominanz von STAMMKonsT über UMLAUT beweist.” Bei dem Input 
/gast+i/ muss, solange es nur die beiden dargestellten Kandidaten gibt, 
im Output entweder STAMMKonsT oder UMLAUT verletzt werden. In allen 
Situationen, in denen nicht beide Beschränkungen erfüllt werden können, 
stellt die Rangfolge [STAMMKonsT > UMLAUT] sicher, dass STAMMKONST 
beachtet und UMLAUT verletzt wird. 

In einer anderen Sprache oder einer späteren Sprachstufe mit der 
umgekehrten Rangfolge [UmLAUT > StamMKonst] wird die Verletzung 
der Beschränkung STAMMKonST dadurch erzwungen, dass UMLAUT einen 
höheren Rang in der Hierarchie hat. Das Ergebnis ist eine untreue 
Abbildung des Inputs, wie Tableau (43) zeigt. 


(43) UMLAUT > STAMMKONST 


/gast +i/ UMLAUT STAMMKONST 
a. gasti Bi 
b.® gesti = 


Eine Rangfolge [M > T], z.B. [UmLauT > StammKonst], bildet in der 
Optimalitätstheorie jene sprachlichen Phänomene ab, die in anderen 
Theorien als Prozesse, Regeln, Transformationen oder Operationen 
dargestellt werden. Immer wenn ein treu abgebildeter Input die 
dominierende Markiertheitsbeschränkung M verletzen würde, wird ein 
Kandidat ausgewählt, der M beachtet, dafür aber die dominierte 
Treuebeschränkung F verletzt. Treuebeschränkungen können also verletzt 
werden, aber die Verletzung erfolgt nie grundlos, sie muss immer von 


52 In der Sprachstufe vor dem Auftreten des Umlauts, also dem 
Voralthochdeutschen, muss die Rangfolge |STAMMKONST > UMLAUT| gegolten 
haben, sonst wäre nicht gasti, sondern gesti der optimale Outputkandidat. Das 
Auftreten der unumgelauteten Form gasti beweist insofern die Rangfolge 
|STAMMKONST > UMLAUT|. 
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einer Markiertheitsbeschrankung erzwungen werden. Die Verletzung von 
F wird jedoch so minimal wie möglich gehalten. 

Das Ziel, verbotene Konfigurationen im Output zu vermeiden, kann 
durch verschiedene Prozesse erreicht werden (Homogeneity of 
Target/Heterogeneity of Process, HoT-HoP). In der Optimalitätstheorie wird 
dies durch die Interaktion einer Markiertheitsbeschränkung M mit zwei 
Treuebeschränkungen T1 und T2 abgebildet. Wenn M sowohl von T1 als 
auch von T2 dominiert wird, dann werden alle Inputformen treu im 
Output abgebildet, vergleichbar mit der Situation in Tableau (42). Wenn 
aber wenigstens eine der beiden Treuebeschränkungen einen niedrigeren 
Rang hat als M, dann erzwingt M die Verletzung der dominierten 
Treuebeschränkung. Nimmt man für M die Markiertheitsbeschränkung 
UMLAUT, für T1 die Treuebeschrankung STAMMKONST und für T2 die 
Treuebeschränkung NIcHTTILG (mit der Forderung ‘Tilgungen sind 
verboten’), so ergeben sich vier mögliche Rangfolgen, in denen UMLAUT 
mindestens eine der beiden Treuebeschränkungen dominiert. 


(44) Rangfolgen, in denen UMLAUT die Treuebeschränkung STAMMKONST 
oder NICHTTILG (oder beide) dominiert 


(44a) UMLAUT > STAMMKONST > NICHTTILG 
STAMMKONST > UMLAUT > NICHTTILG 


(44b) UMLAUT > NICHTTILG > STAMMKONST 
NICHTTILG > UMLAUT > STAMMKONST 


Die Rangfolgen unter (44a) mit NicHTTILG am unteren Ende der 
Hierarchie bevorzugen die Abbildung /gast+i/ — gast, wie Tableau (45) 
illustriert. 
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(45) Rangfolgen für Input /gast+i/ — Output [gast] 


(45a) UMLAUT > STAMMKONST > NICHTTILG 


/gast +i/ UMLAUT | STAMMKONST | NICHTTILG 


* 


a. 7 [gast] 


b. [gesti] F 


c. [gasti] 


(45b) STAMMKONST >> UMLAUT > NICHTTILG 


/gast+i/ STAMMKonsT | UMLAUT | NICHTTILG 


* 


a. 7 [gast] 


b. [gesti] * 


c. [gasti] 


Der optimale Kandidat a verletzt NicHTTıLc, da die Endung /-i/ des Inputs 
getilgt wird. Durch die Tilgung von /i/ wird jedoch die UMLAUT- 
Beschränkung erfüllt, da jetzt kein i oder j mehr auf den Stammvokal 
folgt.” Auch StamMKonst wird nicht verletzt, da der Stamm /gast/ im 


53 Es mag zunächst seltsam erscheinen, dass die Outputform [gast] die 
Beschränkung UMLAUT nicht verletzt. Markiertheitsbeschränkungen formulieren 
jedoch keine Regeln, sondern Verbote oder Forderungen hinsichtlich bestimmter 
Konstellationen im Output. Durch die i-Tilgung wird die durch die UMLAUT- 
Beschränkung verbotene Outputkonstellation vermieden. Dass die Tilgung eines 
unbetonten Vokals durchaus als mögliche Lösung zu berücksichtigen ist, zeigt ein 
Blick auf Vokaltilgungen in offener Silbe zur Vermeidung eines Hiats, die 
gelegentlich in althochdeutschen Texten anzutreffen ist, vor allem vor enklitischen 
Personalpronomen (Braune & Reiffenstein 2004: 861): ahd. det er (=deta er), wan 
ih (=wanu ih), quid ih (=quidu ih). Im Mittelhochdeutschen wird in Präfixen 
häufig /a/ getilgt, wenn dadurch eine unerwünschte Konstellation, wie z.B. ein 
Hiat, vermieden wird (Paul 2007: §L55): mhd. gezzen (=ge+ezzen), genden 
(=ge+ enden) bange (= be + ange), binnen (=be + innen). Die Tilgung des i wäre also 
eine weitere mögliche Strategie neben der Umlautung gewesen, um die Abfolge 
eines hinteren Vokals vor einem vorderen Vokal zu vermeiden. 
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Output [gast] treu abgebildet ist. Die unterlegenen Kandidaten b und c 


können dagegen nicht 


gewinnen, 


weil 


sie die 


Beschränkungen STAMMKoNST bzw. UMLAUT verletzen. 
Die Rangfolgen unter (44b) mit STAMMKonsT am Ende der Hierarchie 
bevorzugen die Abbildung /gast+i/ — [gesti], wie in (46) gezeigt. 


(46) Rangfolgen für Input /gast+i/ — Output gesti 


(46a) UMLAUT > NICHTTILG > STAMMKONST 


höherrangigen 


/gast+i/ UMLAUT | NICHTTILG | STAMMKONST 
a. [gast] He 
b. 7 [gesti] * 
G [gasti] * 
(46b) NICHTTILG > UMLAUT >> STAMMKONST 
/gast +i/ NICHTTILG | UMLAUT | STAMMKONST 
a. [gast] * 
b. 7 [gesti] * 
c. [gasti] = 
Die relative Rangfolge von UMLAUT gegenüber STAMMKonST in (45a) und 


(45b) ist also irrelevant dafür, dass der Input /gast+i/ auf den Output 
[gast] abgebildet wird. Ebenso spielt die relative Rangfolge von UMLAUT 
und NicHTTiLG in (46a) und (46b) keine Rolle bei der Abbildung des 
Inputs /gast+i/ auf den Output [gesti]. 

Auch die Blockierung von Prozessen wird in der Optimalitätstheorie 
durch die Interaktion verschiedener Beschränkungen abgebildet. Da 
Beschränkungen verletzbar sind, können in einer Sprache Outputformen 
erlaubt sein, die eine bestimmte Markiertheitsbeschränkung M verletzen. 
Dennoch kann M unter speziellen Bedingungen in dieser Sprache aktiv 
sein. Die Rangfolge [M > T] kann durch Hinzufügung einer dritten 
Beschränkung B modifiziert werden, die M dominiert und gelegentlich 
deren Verletzung erzwingt. B blockiert dann den Prozess, der durch [M 


135 


> T] abgebildet wird. Diese dritte Beschränkung B kann entweder eine 
Markiertheitsbeschränkung oder eine Treuebeschränkung sein. 

Angenommen, B sei eine Markiertheitsbeschränkung Bm, dann muss 
zur Abbildung des Blockierungsmusters, bei dem M nur partiell aktiv ist, 
die Beschränkung B,, durch einige, aber nicht alle Kandidaten verletzt 
werden, die die Beschränkung M beachten. Als Beispiel für eine solche 
Blockierung eines Prozesses kann die Senkung von germ. u zu ahd. o vor 
a, e, o dienen (Braune & Reiffenstein 2004: 832). Die Reflexe dieser 
Senkung zeigen sich im regelmäßigen Wechsel von u und o in der 
Verbalflexion und in der Nominalbildung des Althochdeutschen: ahd. 
gibotan ‘bieten (Part. Prät. — butun ‘bieten (Prat. Pl.)’, ahd. gigozzan 
‘gießen (Part. Prät.)’ — guzzun ‘gießen (Prat. Pl.)’; ahd. wolla ‘Wolle’ (< 
germ. *wullö) — wullin ‘aus Wolle’, ahd. gold ‘Gold’ (< germ. *gulba) — 
guldin ‘gülden’. Die Senkung u > o unterbleibt allerdings vor 
Nasalverbindungen (m, n + Konsonant). So heißt es ahd. zunga ‘Zunge’ 
(< germ. *tungön), hunt ‘Hund’ (< germ. hunda), wunt ‘verwundet’ (< 
germ. *wunta). Für den Zweck dieses Beispiels soll der allgemeine 
Senkungsprozess u > o mit der Markiertheitsbeschränkung SENK,., 
modelliert werden, die fordert, dass der Stammvokal u zu o gesenkt wird, 
wenn a, e oder o folgen. Damit die Senkung stattfindet, muss die 
Rangfolge [SENK,., > STAMMKONST] gelten, da andernfalls STAMMKoNST 
die Veränderung des Stammvokals verhindern würde. Es ergibt sich das 
Tableau unter (47). 


(47) Senkung germ. u > oin germ. wullö ‘Wolle’ 


/wullö/ SENK, 5, STAMMKONST 


* 


a. wullö 


b. & wollö 


Die Markiertheitsbeschrankung B, soll fordern, dass vor 
Nasalverbindungen nur Vokale stehen dürfen, die als [+hoch] 
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spezifiziert sind.°* Nur wenn die Beschränkung By einen höheren Rang 
als SENK,-. hat, kann sie die Vokalsenkung in den Fällen verhindern, in 
denen die Senkung zu einer unerwünschten Abfolge aus nicht-hohem 
Vokal + Nasal + Konsonant führen würde. Tableau (48) illustriert dies 
am Beispiel von germ. hunda ‘Hund’. 


(48) Verhinderte Senkung germ. u > oin germ. hunda ‘Hund’ 


/hunda/ By SENK,,, | STAMMKONST 


* 


a. 7 hunda 


b. honda S a 


Die Senkung von u zu o in germ. wullö beweist, dass SENK,» im 
Germanischen aktiv ist und die Beschränkung STAMMKonsT dominiert. 
Dennoch verletzt in Tableau (48) der optimale Kandidat [hunda] die 
Beschränkung SENK,-.. Diese Verletzung ist notwendig, weil der 
alternative Kandidat [honda] die noch höherrangige Beschränkung B,, 
verletzt. Dass der alternative Kandidat [honda] zusätzlich die 
nachrangige Beschränkung STAMMKONST verletzt, spielt bei der Bewertung 
keine Rolle mehr. 

Auch eine hochrangige Treuebeschränkung, B,, kann ein 
Blockierungsmuster erzeugen, wenn sie noch über M in der Rangfolge [M 
> T] angesiedelt ist. Damit M nur partiell aktiv ist, muss B, einige, aber 
nicht alle untreue Abbildungen verbieten, die die Rangfolge [M > T] 
ansonsten erzwingen würd. B, kann zum Beispiel eine 
positionsabhängige Treuebeschränkung sein, die nur für Laute in 
bestimmten, prominenten Stellungen gilt. Diese positionsabhängigen 
Treuebeschränkungen unterscheiden sich von anderen 
Treuebeschränkungen allein darin, dass sie auf eine bestimmte Domäne 
bezogen sind, z.B. auf betonte Silben, Stämme, Wortanfangsränder oder 
Langvokale. Im Folgenden soll als Beschränkung B, eine 
positionsabhängige Version von STAMMKONST verwendet werden, die die 


54 Diese Beschränkung ist auch für die Hebung von germ. e zu ahd. i vor 
Nasalverbindungen verantwortlich, z.B. bei ahd. bintan, rinnan, swimman, minza 
(<lat. menta) ‘Minze’, vgl. Braune (2004: 830). 
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Mutation langer Stammvokale verbietet, ohne etwas tiber die Mutation 
kurzer Stammvokale auszusagen. Das daraus resultierende Muster zeigt 
sich auch im Germanischen, wo nur kurzes u, nicht aber langes ü 
(=/uu/) gesenkt wird.” So lauten die Reflexe von germ. ü im 
Frühalthochdeutschen immer ü, unabhängig vom Folgevokal: ahd. tüba 
‘Taube’ (< germ. *dübon), ful ‘faul’ (< germ. *fula), mūra ‘Mauer’ (< lat. 
mürus). Tableau (49) verwendet germ. *füla als Beispiel. Entscheidend für 
den Sieg von Kandidat a ist allein die Verletzung der Beschränkung B, 
durch den alternativen Kandidaten b. Dass Kandidat b zusätzlich die 
nachrangige Beschränkung STAMMKonST verletzt, spielt auch hier keine 
Rolle mehr bei der Bewertung. 


(49) Keine Senkung u > o beim Langvokal ü in germ. füla 


/füla/ By SENK,>0o | STAMMKONST 


* 


a. 7 fūla 


b. fola * * 


Zusammenfassend heißt dies, dass die Aktivität von Markiertheits- 
beschränkungen unterschiedlich gesteuert werden kann. Die Rangfolge |T 
> M] erzwingt eine treue Abbildung des Inputs im Output auch dann, 
wenn der Output die Markiertheitsbeschränkung M verletzt. Die 
umgekehrte Rangfolge [M > T] bildet den Input auf untreue 
Outputformen ab, die die Markiertheitsbeschränkung M erfüllen. Sobald 
eine dritte Beschränkung, sei dies nun eine Treue- oder eine 
Markiertheitsbeschränkung, einen Rang über |M > T] einnimmt, wird 
das Auftreten untreuer Outputformen eingeschränkt, und zwar in 
Abhängigkeit von den Forderungen der höherrangigen, dritten 
Beschränkung. 


5 In dem Diphthong germ. eu wird das u dagegen durchaus vor 
nachfolgendem a, e, o zu o gesenkt (Braune & Reiffenstein 2004: 847). Die 
Diphthonge des Germanischen werden also nicht durch die Beschränkung B, vor 
einer Senkung geschützt. 
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4. AGREE-[F] und IDENT-[F] 


Die Optimalitätstheorie stellt mit der Interaktion verschiedener 
verletzbarer Beschränkungen einen speziellen Rahmen zur Modellierung 
lautlicher Variation nicht nur für vokalharmonische Systeme, sondern 
auch für den i-Umlaut im Althochdeutschen mit seinen 
Nebenbedingungen zur Verfügung. Dieser Ansatz steht in Konkurrenz zur 
Rekonstruktion des Umlauts bei Iverson, Davis & Salmons (1994) im 
Rahmen des Autosegmentalen Modells. Der offensichtliche Konflikt 
zwischen verschiedenen Bedingungen, die für den Umlaut im 
Althochdeutschen gelten, wird im Folgenden allein durch die Interaktion 
verletzbarer OT-Beschränkungen modelliert. Die Ableitung der Details 
des Umlauts werden nicht der autosegmentalen Repräsentation oder der 
Einschränkung von Anwendungsregeln auferlegt (z.B. Underspecification 
of Input, Autosegmental Linking Condition etc.). Angestrebt wird damit eine 
möglichst umfassende Berücksichtung aller Umlautausnahmen bei einem 
gleichzeitig hohen Erklärungswert. 

Assimilationen zwischen benachbarten Segmenten können in der 
Optimalitätstheorie mit Hilfe von Übereinstimmungsbeschränkungen des 
Typs AGREE-[F] beschrieben werden (Lombardi 1999). 


(50) AGREE-[F] 


‘Benachbarte Segmente müssen hinsichtlich ihres Wertes für 
das Merkmal [F] übereinstimmen.’ 


Bei der optimalitätstheoretischen Rekonstruktion des Umlauts im 
Althochdeutschen soll auf diese Familie von Beschränkungen 
zurückgegriffen werden. Sie wurde unter anderem auch zur Modellierung 
vokalharmonischer Prozesse angewandt. Jede AGREE-Beschränkung 
fordert, dass benachbarte Elemente hinsichtlich eines bestimmten 
phonologischen Merkmals [F] übereinstimmen. So verlangt AGREE- 
[rund], dass benachbarte Vokale eines Wortes in ihrer 
Merkmalsspezifikation für [rund] übereinstimmen, AGREE-[hinten] 
verlangt dasselbe für das Merkmal [hinten]. 

Eine Beschränkung des Typs AGREE-[F] wird jeweils einmal verletzt 
durch jede Änderung im Merkmalswert [F]. AGREE-[stimmhaft] wird 
zweimal verletzt durch die Obstruentenfolgen [btg] oder [pdk], da sich 
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der Wert des Merkmals [stimmhaft] jeweils zweimal ändert (+ — + und 
—+-). Die Obstruentenfolgen [btk] oder [pdg] verletzen die 
Beschränkung jeweils nur einmal, da es jeweils nur einen Übergang von 
[+stimmhaft] zu [-stimmhaft] gibt. Wie in der Optimalitätstheorie 
üblich, wird die Verletzung der Übereinstimmungsbeschränkung so weit 
minimiert, wie es die Rangordnung relativ zu anderen, konfligierenden 
Beschränkungen erlaubt.” Mit Hilfe der Beschränkungen AGREE-[F] lässt 
sich Vokalharmonie unmittelbar ausdrücken, wenn man für [F] ein 
vokalisches Merkmal, wie etwa [hinten], [rund] oder [ATR], einsetzt. 
Dass Sprachen keine absolute Vokalharmonie haben, wird theoretisch 
darin abgebildet, dass diese Beschränkung, wie alle anderen 
Beschränkungen in OT, verletzbar ist und immer in Konflikt mit anderen 
Beschränkungen steht. Das Ausmaß, in dem eine Sprache Vokalharmonie 
zeigt, spiegelt sich darin wider, wie hoch in der Beschränkungshierarchie 
dieser Sprache die AGREE-Beschränkung relativ zu den anderen 
Beschränkungen eingeordnet ist. 

Nach der Definition in (50) können alle Assimilationen, auch 
Vokalharmonie und Umlaut, immer nur strikt lokal sein, weil sich die 
Formulierung nur auf benachbarte Segmente bezieht. Da phonologische 
Merkmale letztlich die Konfiguration der Artikulatoren beschreiben und 
die Artikulatoren während des Sprechens in kontinuierlicher Bewegung 
sind, kann nur ein Ansatz mit strikter Adjazenz die phonetischen 


56 Es spielt dabei keine Rolle, ob binäre oder privative Merkmale angesetzt 
werden. Eine Übereinstimmungsbeschränkung vergleicht benachbarte Segmente 
und gilt nur dann als verletzt, wenn sich diese Segmente hinsichtlich des 
fraglichen Merkmals unterscheiden. Nimmt man an, das Merkmal [stimmhaft] sei 
binär, so wird AGREE-[stimmhaft] verletzt durch einen Laut, der als [+ stimmhaft] 
spezifiziert ist und neben einem anderen Laut steht, der als [-stimmhaft] 
spezifiziert ist. Andernfalls ist die Beschränkung erfüllt. Dies gilt im Übrigen 
unabhängig von der Reihenfolge, in der stimmhafte und stimmlose Laute 
aufeinander folgen. Unter der Annahme, das Merkmal [stimmhaft] sei privativ, 
wird die Beschränkung AGREE-[stimmhaft] verletzt durch einen Laut, der als 
[stimmhaft] spezifiziert ist und neben einem anderen Laut steht, der nicht als 
[stimmhaft] spezifiziert ist. Andernfalls gilt die Beschränkung als erfüllt. Der 
Einfachheit halber wird im Nachfolgenden mit binären Merkmalen gearbeitet, 
ohne dass viel davon abhinge. Die Analyse funktioniert ceteris paribus auch mit 
privativen Merkmalen. 
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Grundlagen der Assimilationsprozesse fundiert erfassen: Phonologische 
Merkmale könnten zwar theoretisch mehrere Laute überspringen, der 
Artikulationsapparat aber befindet sich in der Praxis immer nur in 
fließender Bewegung. So haben auch die Vokale einer Sequenz /VCV/ 
nur dann ein vokalisches Merkmal im Sinne von AGREE-[F] gemein, wenn 
der zwischenstehende Konsonant dieses Merkmal ebenfalls trägt; und die 
Konsonanten in einer Sequenz /CVC/ haben ein konsonantisches 
Merkmal nur dann gemein, wenn auch der zwischenstehende Vokal 
dieses Merkmal trägt. Dass Vokalharmonie wesentlich häufiger als 
Konsonantenharmonie in den Sprachen der Welt vorkommt, spiegelt sich 
auf theoretischer Ebene darin wider, dass Konsonanten zwar vokalische 
Merkmale tragen können, aber umgekehrt Vokale keine konsonantischen 
Merkmale. Das Hinzufügen konsonantischer Merkmale zu der 
Repräsentation eines Vokals führt per definitionem zu der Repräsentation 
eines Konsonanten. Fügt man jedoch zu der Repräsentation eines 
Konsonanten ein vokalisches Merkmal hinzu, so repräsentiert sie 
weiterhin einen Konsonanten. Im phonologischen Sinne partizipieren 
Konsonanten also an Vokalharmonie, sofern sie vokalische Merkmale 
tragen.” 

Fine Besonderheit der hier vorgestellten Analyse besteht darin, dass 
der Umlaut als links-rechts-symmetrisch aufgefasst wird, d.h. sowohl 
regressiv als auch progressiv wirkt. Auch die Mitglieder der 
Beschränkungsfamilie AGREE-[F] sind links-rechts-symmetrisch. Das 
bedeutet, dass es zu jedem Input wenigstens zwei Output-Kandidaten 
gibt, die hinsichtlich AcGreEE-[F] optimal sind: einer, bei dem alle 
Segmente als [+F] spezifiziert sind, und ein anderer, bei dem alle 
Segmente als [— F] spezifiziert sind. Stehen im Input zwei Segmente mit 
unterschiedlichen Werten für das Merkmal [F] nebeneinander, so müsste 
sich, um AGREE-[F] nicht zu verletzen, entweder das erste Segment 
hinsichtlich des Merkmals [F] an das zweite Segment anpassen oder 
umgekehrt das zweite Segment an das erste. Aus Sicht der Beschränkung 
AGREE-[F] sind die beiden assimilierten Output-Kandidaten gleich gut. 
Die Wahl zwischen den Kandidaten wird von anderen Beschränkungen 


57” Es geht dabei ausschließlich um die gängige, kategorielle Unterscheidung 
zwischen Konsonanten und Vokalen. Phonetisch gesehen ist der Übergang 
zwischen Vokalen und Konsonanten fließend. 
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getroffen, nämlich von Markiertheits- und Treuebeschrankungen, die in 
der Optimalitätstheorie fest etabliert sind.°® Diese Beschränkungstypen 
und ihre Interaktion werden im Folgenden erläutert. 

Dort, wo sich Markierungsbeschränkungen auf phonologische 
Merkmale beziehen, müssen auch Treuebeschränkungen in Bezug auf 
Merkmale gelten. McCarthy & Prince (1995; 1999) haben zur Abbildung 
der merkmalsbezogenen Treue die Beschränkungsfamilie IDENT-[F] 
vorgeschlagen, die in den meisten OT-Analysen seitdem auch verwendet 
wird. 


(51) Merkmalstreue in der Korrespondenztheorie 
(5la) IDEnT-[F] 


‘Korrespondierende Segmente müssen denselben Wert für das 
Merkmal [F] haben.’ 


(51b) Korrespondenz 


Definition: Seien S, und S, zwei Sequenzen, so ist 
Korrespondenz eine Beziehung R von den Elementen aus S, zu 
den Elementen aus S,. Die Elemente a €e S, und ße S, 
korrespondieren miteinander, wenn aRß (d.h. sie sind 
Korrespondenten zueinander). 


Die Mitglieder der Beschränkungsfamilie IDENT-[F] werden weiter 
unterteilt, je nach der Klasse der Elemente, aus der S1 und S2 
entstammen. So beschreiben McCarthy & Prince (1995; 1999) die 


58 Baković (2000) analysiert die beiden Grundtypen der Vokalharmonie, 
stammkontrollierte und dominant-rezessive Vokalharmonie, ebenfalls mit Hilfe 
von Beschränkungen aus der Familie AGREE-[F]. Nach dieser Analyse ist die 
scheinbare Unidirektionalität stammbasierter Vokalharmonie in Wirklichkeit 
abhängig von der morphologischen Struktur der Sprache. Werden Suffixe 
harmonisiert, so breitet sich Vokalharmonie nach rechts aus, werden Präfixe 
harmonisiert, breitet sich Vokalharmonie nach links aus. Die Direktionalität ist 
nach dieser Analyse kein unabhängiger, eigenständiger Parameter der Assimilation 
(Beckman 1998; Lombardi 1999). Die bidirektionale Analyse mit Hilfe von AGREE- 
[F] erlaubt eine einheitliche Modellierung dominant-rezessiver und stamm- 
kontrollierter Vokalharmonien — und, wie sich zeigen wird, auch die 
Modellierung des Umlauts. 
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Beziehung zwischen Reduplikationsmorphemen und Reduplikationsbasis 
mit Hilfe von IpentT-[F]-Beschrankungen, die als BR-IDENT-[F]- 
Beschrankungen bezeichnet werden (B=Basis, R=Reduplikant). Auch 
die Beziehung zwischen Input und Output kann mit IpeEnT-[F] 
beschrieben werden, den IO-Ipent-[F]-Beschränkungen (I=Input, 
O=Output). Sie regeln die Beziehung zwischen der zugrundeliegenden 
Repräsentation und der Oberflächenrepräsentation. Weiterhin können 
IDEnT-[F]-Beschränkungen die Beziehung zwischen affigierten Formen 
und dem Stamm der Affigierung beschreiben. Dies sind SA-IpEnT-[F]- 
Beschränkungen (S=Stamm, A=Affix), die besonders für stamm- 
kontrollierte Vokalharmonie relevant sind (Baković 2000). 
Positionsabhängige Neutralisationen wurden von Beckman (1998; 2002) 
mit Treuebeschränkungen beschrieben, die sich speziell auf prominente 
morphologische Kategorien und prominente prosodische Positionen 
beziehen (positional faithfulness), z.B. Anfangssilbe von Stämmen oder 
prosodischen Wörtern, betonte Silben, Silbenanfangsränder, lange 
Vokale. Häufig tritt zum Beispiel ein Kontrast zwischen Merkmalswerten 
nur in Stammmorphemen (IDENT-RooT-[F]) oder in betonten Silben 
(IDENT-ONSET-[F]) auf, ist aber ansonsten neutralisiert. 


5. Exkurs: Prosodie des Althochdeutschen 


Der i-Umlaut im Althochdeutschen ist abhängig von Akzentverhältnissen. 
Dass die allgemein übliche Beschreibung des Umlauts als ‘Assimilation 
des betonten Stammvokals an nachfolgende unbetonte i oder j eine grobe 
Verallgemeinerung ist, wurde bereits dargelegt. Die Verhältnisse sind 
komplizierter und der Umlaut interagiert auf verschiedene Weise mit der 
Prosodie. Daher wird in diesem Exkurs zunächst eine Analyse der 
prosodischen Struktur althochdeutscher Wörter, sofern sie für die 
Klärung der Umlauträtsel relevant is, im Rahmen der 
Optimalitätstheorie vorgeschlagen. 

Im Althochdeutschen fällt die Betonung auf die erste Stammsilbe. 
Ausgedrückt werden kann dieses Betonungsmuster durch 
Ausrichtungsbeschränkungen, die sich auf die Ränder verschiedener 
Konstituenten beziehen (edge alignment constraints). Das Schema dieser 
Beschränkungen ist in (52) dargestellt (s. McCarthy & Prince 1993). 
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(52) Auıcn(Katl, Kat2, Rand) 


‘Jedes Element am Rand einer Katl, steht auch am Rand einer 
Kat2.’ (Wobei für Katl und Kat2 grammatische oder 
prosodische Konstituenten einzusetzen sind, für Rand ‘linker 
Rand’ oder ‘rechter Rand’.) 


Auıcn-Beschränkungen fordern, dass Konstituentenränder sich decken. 
Kat1 ist durch einen Allquantor gebunden, Kat2 durch einen 
Existenzquantor. Die Beschränkung Auıcn(betonte Silbe, Fuß, links) 
verlangt, dass der linke Rand jeder betonten Silbe auch der linke Rand 
eines Fußes ist. Abgekürzt wird die Beschränkung als ALIGN-L(6, 9), 
wobei 6 für die betonte Silbe, ọ für den Fuß und L für den linken Rand 
steht. ALIGN-L(6, @) wird im Althochdeutschen von keiner anderen 
Beschränkung dominiert, d.h. alle betonten Silben müssen am linken 
Rand eines Fußes stehen. Oder umgekehrt ausgedrückt: Außerhalb von 
Füßen gibt es keine betonten Silben.°? 

Zwei weitere ALIGN-Beschrankungen sind zur Beschreibung der 
prosodischen Struktur des Althochdeutschen notwendig, sofern die 
Prosodie für den Umlaut relevant ist: zum einen ALIGN-L(@, œ), die 
postuliert, dass alle linken Ränder eines Fußes auch am linken Rand 
eines prosodischen Wortes stehen; zum anderen ALIGN-L(Rt, @), die 
fordert, dass der linke Rand jeder Wurzel am linken Rand eines 
prosodischen Wortes steht. Alle drei beschriebenen ALIGN- 
Beschränkungen werden im Althochdeutschen nicht dominiert, d.h. die 
Betonung fällt im Althochdeutschen immer auf die erste Stammsilbe 
eines Wortes. Eine vierte Beschränkung, HEAD(@), fordert schließlich, 
dass alle prosodischen Wörter einen strukturellen Kopf haben müssen 
(Selkirk 1980; McCarthy & Prince 1999). Für einfache prosodische 
Wörter bedeutet dies, dass sie als Kopf der Konstruktion einen Fuß haben 
müssen. In komplexen prosodischen Wörtern, die aus mindestens zwei 
prosodischen Wörtern aufgebaut sind, muss eines der dominierten 


5 Die betonte Silbe bildet den strukturellen Kopf des prosodischen Fußes. 
Jeder Fuß enthält genau eine betonte Silbe. Diese beiden Vorgaben für die 
Silbenstruktur gehören zu den einfachen Strukturprinzipien, die für alle Sprachen 
gleich sind. Sie werden daher nicht durch OT-Beschränkungen ausgedrückt, weil 
sie in keiner Sprache verletzbar sind. 
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prosodischen Worter als Kopf dienen. Die Beschrankungen sind unter 
(53) noch einmal zusammengefasst. 


(53) Undominierte Beschrankungen der prosodischen Struktur im 
Althochdeutschen 


(53a) ALIGN-L(6, ©) 
‘Der linke Rand jeder betonten Silbe ist auch der linke Rand 
eines Fußes.’ 


(53b) ALIGN-L(@, œ) 
‘Der linke Rand jedes Fußes ist auch der linke Rand eines 
prosodischen Wortes’ 


(53c) ALIGN-L(Rt, œ) 
‘Der linke Rand jeder Wurzel ist auch der linke Rand eines 
prosodischen Wortes’ 


(53d) HEAD(@) 
‘Alle prosodischen Wörter haben einen strukturellen Kopf 
(entweder einen Fuß oder ein dominiertes prosodisches 
Wort).’ 


Für die Verfußungsmuster im Althochdeutschen wird hier, wie üblich, 
angenommen, dass sie als morenzählend, und nicht silbenzählend wie im 
Neuhochdeutschen, zu beschreiben sind. Seit Jakobsen (1931) und 
Trubetzkoy (1939) wird der Unterschied zwischen leichten und schweren 
Silben, der in zahlreichen Sprachen relevant ist, durch den Begriff der 
Mora (als der Einheit des Silbengewichts) wiedergegeben. Nach der 
moraischen Theorie sind leichte Silben einer einzelnen Mora (u), schwere 
Silben zwei Moren (uu) zugeordnet. Die leichten Silben in (54a) sind 
daher mit einer Mora verbunden, schwere Silben in (54b) mit zwei 
Moren. 
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(54) Silbengewicht in Moren 


(54a) Leichte Silben 
[ta . pal] 


o GC 
Ir I 
t a p a 


(54b) Schwere Silben 
[ta:] [tap] [tapa] 


Gezählt werden die Moren für alle Laute vom Silbennukleus bis zum 
rechten Silbenrand, und zwar trägt jeder Konsonant und jeder Kurzvokal 
eine Mora zum Silbengewicht bei, jeder Langvokal und Diphthong ist mit 
zwei Moren verbunden.®© Konsonanten im Silbenanfangsrand sind nicht 
moraisch und für das Silbengewicht nicht relevant, es sei denn ein 
Konsonant steht im Silbengelenk und zählt gleichzeitig zum Endrand der 
vorangehenden Silbe, vgl. [tapa] in (54b). 

Wenn Füße im Althochdeutschen binär sein sollen, so bedeutet dies, 
dass sie nach Möglichkeit zweimorig sind. Binarität ließe sich alternativ 
auch durch Zweisilbigkeit statt Zweimorigkeit herstellen (vgl. Hayes 
1995 mit einer Diskussion zu binären Füßen in der Metrik). 
Zweisilbigkeit spielt im Althochdeutschen aber keine Rolle. In einem 
althochdeutschen Fuß zählt allein das Silbengewicht. Ausgedrückt wird 


6° Für das Althochdeutsche spielt die Frage nach überschweren Silben, die mit 
mehr als zwei Moren verbunden sind, keine Rolle. 
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die Forderung nach Zweimorigkeit des Fußes durch die Beschränkung 
FTBin-u (Prince & Smolensky 2004).°' 


(55) FrBin-u (Fußbinarität) 
‘Füße sind auf moraischer Ebene binär.’ 


FTBin-u wird einerseits durch einmorige Füße verletzt, andererseits aber 
auch durch Füße, die mehr als zwei Moren haben. Beispielsweise wären 
der Fuß la einmorig (= Verletzung von FrBın-u), la: zweimorig (= keine 
Verletzung von FTBın-u), lak dreimorig (= Verletzung von FTBin-u), la:kt 
viermorig (= Verletzungen von FTBin-u), la:kst fünfmorig (= Verletzung 
von FrBin-u). Da FrBin-u die beliebige Verlängerung der Füße verbietet, 
bleiben oft einzelne Silben unverfußt. Durch all jene Silben, die nicht Teil 
eines Fußes sind, wird die Beschränkung PARSE-o verletzt (Prince & 
Smolensky 1993; McCarthy & Prince 1993, 2001; Prince & Smolensky 
2004). 


(56) PARSE-0 
‘Jede Silbe gehört zu einem Fuß.’ 


PARSE-o fordert, dass keine Silbe direkt von einem prosodischen Wort 
dominiert wird. Die Zweimorigkeit des althochdeutschen Fußes wird 
durch die Rangfolge [FrBin-u > ParsE-o] dargestellt. Tableau (57) 
veranschaulicht die Verfußung von ahd. widarön ‘zurückweisen, sich 
sträuben’ mit kurzer Stammsilbe und von ahd. heilazen ‘grüßen’ mit 
langer Stammsilbe. Runde Klammern zeigen die Grenzen des Fußes (=9) 
an. Zur Verdeutlichung des sich aus den Verfußungsvarianten 
ergebenden Silbengewichts ist die moraische Struktur der 
Outputkandidaten jeweils rechts neben dem Tableau angegeben. 


61 Was im Folgenden als Fuß bezeichnet wird, wäre nach Vennemann (1995) 
ein minimaler Fuß. Moren einer Silbe, die nicht Teil des binären Fußes (FTBIN) 
sind, entsprechen ungefähr Vennemanns Senkungen, die an einen minimalen Fuß 
angelehnt werden können und das Silbengewicht des gesamten Fußes vermehren. 
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(57) Füße sind im Althochdeutschen zweimorig: FTBIN-u > PARSE-o © 


(57a) Kurzsilbige Stämme 


/widar + oon/ | FTBIN-u | PARSE-6 | Morenstruktur: 
a. (wi.da.roon), * (u.u. uuu) 
b.= (wi.da),.roon * (u.u).uuu 
c. (wi) .da.roon * ae (u).u.uuu 


(57b) Langsilbige Stämme 


/heilaz+en/ | FTBIN-u | PARSE-o | Morenstruktur: 
a. (hei.la.zen), k (uu.u. uu) 
b. (hei.la),.zen & * (uu.u). uu 
c.= (hei),.la.zen ae (UL). . 


Silben, die nicht in den zweimorigen Fuß am Anfang des Stammes 
aufgenommen werden können, bleiben unverfußt und bilden nicht etwa 
einen weiteren, minimal zweimorigen Fuß.® Die Richtigkeit dieser 
Rekonstruktion wird dadurch bewiesen, dass die meisten 
Mittelsilbenvokale, wie das a in heilazen, im Althochdeutschen von 
Anfang an starken Schwankungen unterworfen sind (Braune & 
Reiffenstein 2004: 864). Dies wäre nicht der Fall, wenn sie durch 
Nebenton geschützt wären, d.h. einen eigenen Fuß bilden würden. 
Unbeschadet dessen gibt es eine Reihe von systematischen Ausnahmen, 
wie z.B. die weiter unten in (67) besprochenen Affixe. 


62 Da der Fuß immer am linken Rand des prosodischen Wortes stehen muss, 
sind in den beiden Tableaus nur linksköpfige Strukturen berücksichtigt. Alle 
anderen Strukturen würden von der undominierten Beschränkung ALIGN-L(@, œ) 
nicht zugelassen, vgl. dazu auch Tableau (58). 

63 In einer Sprache mit der Rangfolge |PARSE-o > ALIGN-L(Y, @)| würden aus 
den verbleibenden Silben nach Möglichkeit wieder binäre Füße gebildet. Ein 
prosodisches Wort kann dann mehrere Füße und damit mehrere Betonungen 
haben, z.B. die Struktur [(60)(6o0)o] oder [6(60)(60)]. Zu den verschiedenen 
Verfußungsvarianten und den entsprechenden Beispielsprachen vgl. McCarthy & 
Prince (1993). 
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Verantwortlich fiir das Unterbleiben der Verfußung nachfolgender 
Silben ist die oben genannte Beschränkung ALIGN-L(@, œ), die PARSE-o 
dominiert. Die ALIGN-Beschrankung erzwingt, dass Füße nur am linken 
Rand eines prosodischen Wortes stehen. Da die Wörter in (57) jeweils 
nur ein einziges prosodisches Wort bilden, können sie auch nur einen 
Fuß haben. Tableau (58) zeigt, dass die zweimorigen Füße bei der 
Rangfolge [ALIGN-L(@, œ) > ParsE-o] immer nur links stehen können. Die 
eckigen Klammern geben die Ränder des prosodischen Worts an. 


(58) Füße stehen im Althochdeutschen links: ALIGN-L(@, @) > PARsE-o °* 


(58a) Kurzsilbige Stämme 


/widar + oon/ ALIGN-L(q, @) PARSE-O 
a. 7 [(wi.da)o.roon] » u 
b. [wi.(da.roon) ] * X 
c. [wi.da.(roon)olo * ia 
d. [Cwi.da),.(roon).]o * 


(58b) Langsilbige Stämme 


/heilaz + en/ ALIGN-L(9, ©) | PARSE-c 
a 7 [(hei)¢.la.zen]o ek 
b. [hei.(la.zen)o]o * 7 
c. [hei.la.(zen)o]o * PR 
d. [Chei),.la.zen),lo * 


Zwar verletzen unverfußte Moren die Beschränkung PARSE-o, diese wird 
jedoch von FTBin-u und ALIGN-L(g, œ) dominiert. Daher können Silben 
auch im optimalen Kandidaten unverfußt sein. Die Kandidaten d. in den 
Tableaus (58a) und (58b) zeigen, dass allein die Rangfolge [ALIGN-L(q, 
@) > ParsE-o] genügt, um zwei Füße in einem prosodischen Wort zu 
verhindern. Der jeweils zweite Fuß (rön) bzw. (la.zen) kann nicht 
linksbündig im prosodischen Wort stehen und verletzt daher ALIGN-L(9, 
o). 


64 Berücksichtigt sind nur zweimorige Füße, da dreimorige Füße durch den 
hohen Rang der Beschränkung FTBIN im Althochdeutschen ausgeschlossen sind. 
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Insgesamt ergeben sich aufgrund der hier aufgeführten 
Beschränkungen sechs verschiedene prosodische Strukturen für flektierte 
Simplizia im Althochdeutschen. Sie bilden die prosodischen 
Grundstrukturen des Althochdeutschen und sind in (59) aufgeführt. Für 
die langsilbigen Stämme sind Flexionsformen von ahd. lamb ‘Lamm’ 
(-iz/-az-Flexion) und für die kurzsilbigen Stämme von ahd. garo “fertig, 
bereit’ (starkes Adjektiv, wa-/wö-Stamm) als Beispiel angeführt. Dabei 
steht in der linken Spalte ö,, für mindestens zweimorige betonte Silben 
und 6, für einmorige betonte Silben. Die durch einfaches o 
symbolisierten Silben sind unbetont. Ihr Silbengewicht ist für die 
prosodische Struktur nicht relevant. Runde Klammern geben die Grenzen 
des Fußes an, eckige Klammern die Grenzen des prosodischen Wortes. 
Die Indizes und sind aus Gründen der Übersichtlichkeit weggelassen. 


(59) Die prosodischen Grundstrukturen im Althochdeutschen 


(59a) Langsilbige Stämme 


Komp) (ldmb) (Nom./Akk. Sg.) 
[(6,,,).6] (lém). bir (Nom./Akk. Pl.) 
[(5,).0.0] (lem).bi.rum (Dat. Pl.) 

(59b) Kurzsilbige Stämme 
[(5..0)] (gd.ro) (Nom. Sg.) 
[(5..0).0] (gd.ra).wes (Gen. Pl.) 
[(6,.6).6.6] (gd.ra).we.mo (Dat. Pl.) 


In diesen prosodischen Strukturen lasst sich ein Prinzip erkennen, das 
stark an die Auflösung zweier kurzer Silben in der klassischen Metrik 
erinnert:°° Im Althochdeutschen ist eine betonte lange Silbe rhythmisch 
äquivalent mit einer betonten kurzen Silbe gefolgt von einer unbetonten 
Silbe. Wie bereits Vennemann (1995) gezeigt hat, ist das 


65 In der lateinischen Metrik ist eine lange Silbe rhythmisch äquivalent mit 
zwei kurzen Silben. Kurze Silben sind offen und haben einen Kurzvokal als 
Nukleus, z.B. [bo], [fra]. Lange Silben haben einen Diphthong oder Langvokal im 
Nukleus und/oder sind durch Konsonanten geschlossen, z.B. [fra:], [bo:], [frai], 
[boi] [frak], [bok]. Üblich sind auch die Bezeichnungen „schwer“ für lange Silben 
und „leicht“ für kurze Silben. 
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Auflösungsprinzip nicht nur für die lateinische Dichtung, sondern auch 
für die Alt- und Mittelhochdeutsche Versmetrik von Bedeutung. Darüber 
hinaus spielt die prosodische Äquivalenz von (5) und (6,.0) eine 
wichtige Rolle für die Analyse von lautlichem und morphologischem 
Wandel auch, aber nicht nur, in der Sprachgeschichte des Germanischen 
(vgl. dazu Vennemann 1995). So haben die Maskulina der i- und 
u-Stämme im Altsächsischen und im Althochdeutschen nach schwerer 
Stammsilbe ihren Themavokal i bzw. u im Nominativ und Akkusativ 
Singular verloren, nach kurzer Stammsilbe aber behalten, vgl. (60) und 
(61).°% 


(60) Maskuline i- und u-Stämme im Altsächsischen 
(Beispiele nach Vennemann 1995:192f.) 


(60a) kurzsilbige i-Stämme mit erhaltenem Themavokal 
as. wini ‘Freund’, meti ‘Speise’, stiki ‘Stich’ 


(60b) langsilbige i-Stämme ohne Themavokal 
as. gast ‘Gast’, ball ‘Ball’, wag ‘Woge’ 
(60c) kurzsilbige u-Stämme mit erhaltenem Themavokal 


as. sunu ‘Sohn’, fridu ‘Friede’, sidu ‘Sitte’ 


(60d) langsilbige u-Stämme ohne Themavokal 
as. wald ‘Wald’, thorn ‘Dorn’, ër ‘Bote’ 


6% Im Althochdeutschen ist die Unterscheidung zwischen lang- und 
kurzsilbigen Stämmen in der i-Deklination nicht mehr streng beibehalten. Die 
Flexion der Kurzsilbigen hat sich meist der Deklination der langsilbigen i-Stämme 
angeschlossen, so dass das i im Nom./Akk. Sg. auch bei ihnen geschwunden ist 
(Braune & Reiffenstein 2004: 8215-220). Die früheren u-Stämme mit langer 
Stammsilbe sind meist in die i-Deklination übergetreten. Nur die kurzsilbigen 
Maskulina der u-Deklination haben im Nom./Akk. Sg. das auslautende u 
regelmäßig behalten, so wie auch das einzige im Althochdeutschen erhaltene 
Neutrum der u-Deklination ahd. fihu ‘Vieh’ (Braune & Reiffenstein 2004 8220a-e). 
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(61) Maskuline i- und u-Stämme im Althochdeutschen 
(Beispiele nach Vennemann 1995:192f.) 


(61a) kurzsilbige i-Stämme mit erhaltenem Themavokal 
ahd. wini ‘Freund’, risi ‘Riese’, quiti ‘Ausspruch’ 


(61b) langsilbige i-Stämme ohne Themavokal 
ahd. gast ‘Gast’, balg ‘Balg’, bah ‘Bach’ 


(61c) kurzsilbige u-Stämme mit erhaltenem Themavokal 
ahd. hugu ‘Sinn’, situ ‘Sitte’, fridu ‘Friede’ 


(61d) langsilbige u-Stämme ohne Themavokal 
ahd. wald ‘Wald’, dorn ‘Dorn’, tod ‘Tod’ 


Der Grund fiir diese unterschiedliche Entwicklung wird deutlich, wenn 
man die Verfußung der lang- und kurzsilbigen i- und u-Stämme im 
Germanischen miteinander vergleicht. Die Verfußung erfolgt im 
Germanischen und im Voralthochdeutschen bereits nach denselben 
Regeln wie im Althochdeutschen. So wird der Nominativ Singular eines 
Langsilbers wie gasti als [(gds),.ti],, verfußt, der eines Kurzsilbers wie 
vorahd. wini aber als [(Wi.ni)]o. Die Form gasti enthält also eine 
unverfußte Silbe, die gegen die Beschränkung ParsE-o verstößt. In der 
Form wini dagegen sind alle Silben Teil eines Fußes. Sie verstößt nicht 
gegen ParsE-o. Durch die Anhebung der Beschränkung PARSsE-o über die 
Treuebeschränkung Max, die gegen die Tilgung von Segmenten des 
Inputs opponiert (McCarthy & Prince 1995, 1999) und damit den 
auslautenden Themavokal i im Nominativ und Akkusativ Singular 
schützt, wird das auslautende i von gasti getilgt. Durch die Tilgung von i 
hat das Wort eine unverfußte Silbe weniger, schneidet also hinsichtlich 
der Beschränkung PaRsE-o besser ab, wie ein Vergleich der Tableaus 
(63a) und (63b) zeigt. In (62) wird zuvor die Beschränkung Max 
definiert. 


152 


(62) Max: 


‘Ein Segment im Input muss mit einem Segment im Output 
korrespondieren.’ 
(Segmente dürfen nicht getilgt werden.) 


(63) Tilgung des Themavokals durch Neuordnung von Max und PARSE-o 


(63a) vor der Tilgung auslautender Themavokale: MAX > PARSE-o 


/gasti/ Max PARSE-O 
a. [(gast)e]o $ 
b. & [(gas),-tilo * 


(63b) Tilgung auslautender Themavokale: PARSE-o > MAX 


/gasti/ PARSE-O Max 
a. 7  [(gast)olo * 
b. [(gas),-tilo * 


Anders verhält es sich bei Kurzsilbern wie wini. Eine Tilgung des 
Themavokals würde keine Verbesserung hinsichtlich PARsE-o bringen, da 
sie auch mit Themavokal nicht gegen PARSE-o verstoßen. Die Form ist 
bereits optimal. Eine Tilgung würde vielmehr eine Verschlechterung 
bedeuten, da die Beschränkung Max verletzt würde. Die Tableaus (64a) 
und (64b) zeigen, dass wini unter jeder der beiden möglichen Rangfolgen 
der optimale Kandidat ist. 


(64) Kurzsilbige i- und u-Stämme sind von der Umkehrung der Rangfolge 
[Max > ParsE-o] nicht betroffen 


(64a) Max > Parse-o 


/wini/ Max PARSE-O 
a. 7 [(wi.ni) olo 
b. [(win)olo x 


(64b) PARSE-o > Max 


/wini/ PARSE-O Max 


a.” [windo 


b. [(win)olo * 
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Die Tilgung des auslautenden Themavokals betrifft jedoch auch 
zusammengesetzte Wörter und eine ganze Reihe von Ableitungen. So ist 
das -i auch in der Komposition ahd. gasthüs ‘Gasthaus’ und in der 
Ableitung gastlih ‘gastlich’ ausgefallen. Systematisch erhalten bleibt das 
auslautende -i jedoch in Kompositionen mit kurzsilbigem Stamm als 
Erstglied wie zum Beispiel ahd. winiliod ‘Liebeslied’ und in einigen 
Ableitungen wie etwa ahd. winiscaft ‘Liebe, Freundschaft’. Sowohl als 
freies Lexem, als Kompositionsglied wie auch als Ableitungsbasis 
bestimmter Suffigierungen verhalten sich die Stämme wini- und gast(i)- 
gleich hinsichtlich der Tilgung des Themavokals. Die weiteren Beispiele 
in (65) zeigen die Systematik. 


(65) Tilgung und Erhalt des Themavokals im Althochdeutschen 
bei Stammformen, Kompositionen und bestimmten Suffigierungen 


(65a) Kurzsilbige Stämme behalten ihren Themavokal 
Nom./Akk. Sg.: wini ‘Freund, Geliebter’ 
fridu ‘Friede 
hugu ‘Friede, Schutz’ 
Komposition: winiliod ‘Liebeslied’ 
fridoman ‘Friedensbringer’ 
hugulust ‘Gesinnung’ 
Suffigierung: winiscaft ‘Liebe, Freundschaft’ 
fridusam ‘friedfertig, friedlich’ 
hugelih ‘erfreulich’ 


(65b) Langsilbige Stamme verlieren ihren Themavokal 

Nom./Akk. Sg.: gast ‘Gast’ (< *gasti) 

wald ‘Wald’ (< *waldu) 

scilt ‘Schild’ (< *skildu) 
Kompositum: gasthüs ‘Gasthaus’ 

waltholz ‘Waldbaum’ 

scil(t)riemo ‘Schildriemen’ 
Suffigierung: gastlih ‘gastlich’ 

waldhaft ‘waldig’ 

sciltari ‘Schildmacher’ 
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In allen diesen Fällen musste vor dem Einsetzen der Tilgung eine 
phonologisch relevante Grenze hinter dem Themavokal liegen. Diese 
Grenze ist der Rand des phonologischen Wortes. Ob der Rand des 
phonologischen Wortes direkt hinter dem Themavokal liegt oder erst 
hinter einem der nachfolgenden Morpheme, wird allein durch den Status 
der nachfolgenden Morpheme bestimmt. Nicht verwunderlich ist, dass 
das zweite Kompositionsglied ein eigenes phonologisches Wort bildet, da 
es selbst ein Lexem ist. Daher ist eine phonologische Wortgrenze 
zwischen Erst- und Zweitglied der Komposition ohnehin zu erwarten. 
Eine Erläuterung wert ist jedoch der Status bestimmter Suffixe als 
prosodisches Wort. 

Bekanntermaßen können einige Affixe einen eigenen Akzent tragen. 
Sie wurden als Klasse-II-Affixe bezeichnet und damit von den 
gewöhnlichen Affixen (Klasse-I-Affixe) unterschieden (vgl. Siegel 1979). 
Klasse-II-Affixe sind betonungsneutral, d.h. sie beeinflussen nicht die 
Betonung der Silben im Stamm der Affigierung. Dies kommt auf der 
prosodischen Beschreibungsebene darin zum Ausdruck, dass Klasse-II- 
Affixen der Status eines eigenen prosodischen Wortes zugeschrieben 
wird: an den Grenzen des prosodischen Wortes enden die meisten 
phonologischen Prozesse, die mit der morphologischen Struktur des 
Wortes interagieren.°” Dass Affixe der Klasse II eigene prosodische Wörter 
bilden, wird durch die Beschränkung ALicn-L(AffixII, œ) ausgedrückt, die 
für den linken Rand jedes Klasse-II-Affixes fordert, dass er auch den 
linken Rand eines prosodischen Wortes bildet. 


67 Ein weiterer Unterschied zwischen den beiden Affixtypen ist, dass Affixe der 
Klasse I näher an der Wurzel stehen müssen als Affixe der Klasse II. Allerdings 
können Klasse-I-Affix auch an Klasse-II-Affixe angefügt werden, so dass sich ein 
Reihefolge-Paradox ergibt (ordering paradox), denn die an ein Klasse-II-Affix 
angefügten Affixe stehen weiter von der Wurzel entfernt als das Klasse-II-Affix, an 
das sie angehängt werden. Beispielsweise könnte die Form ahd. ungastlihi 
‘Ungastlichkeit (Dat. Sg.)’ wie folgt in prosodische Wörter zergliedert werden: 
[fun [gast]o [līih]o Je ilo Das darin enthaltene Klasse-II-Suffix -lih steht dem 
Stamm näher als das Klasse-I-Suffix -i. Zum Reihefolge-Paradox vgl. auch Fabb 
(1988) über das Englische und Smith (2003:59-96) über das Deutsche. 
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(66) ALIiGN-L(AffixII, œ) 


‘Der linke Rand jedes Klasse-II-Affixes ist auch der linke Rand eines 
prosodischen Wortes.’ 


Während die Suffixe -on und -en in (57) Affixe der Klasse I sind, gehören 
die Suffixe ahd. -nissi, -ari, -lih, -lin, -scaft, -lōs, -sam u.a. im 
Althochdeutschen zur Klasse II, bilden also ein eigenes prosodisches 
Wort. Ihr besonderer prosodischer Status zeigt sich darin, dass der erste 
Vokal dieser Suffixe im Germanischen und frühen Althochdeutschen nur 
geringen Schwankungen unterworfen ist. Er ist durch den Nebenton 
geschützt (Braune & Reiffenstein 2004: 863), den er durch seine Stellung 
in der ersten Silbe des prosodischen Wortes erhält. Die prosodische 
Struktur eines suffigierten Wortes wie zum Beispiel ahd. gastnissi 
‘Herberge’ besteht also aus drei prosodischen Wörtern und ist als 
[[gast] [nissi]4] zu rekonstruieren. Die beiden inneren prosodischen 
Wörter [gast], und [nissi], benötigen jeweils einen Fuß als strukturellen 


68 Alle sogenannten „schweren Mittelvokale“ sind entweder lang oder durch 
mehrfache Konsonanz gedeckt und sie sind durch ihren Nebenton geschützt 
(Braune & Reiffenstein 2004 863), z.B. ahd. -āri (scribari ‘Schriftgelehrter’), -€ 
(schwache Verben III: habeta ‘haben (1./3. Sg. Prät.)’, habénti ‘haben (Part. Pras)’), 
-inna (kuninginna ‘K6nigin’), -ig (anahaftigo ‘mit etwas verbunden’, krefig ‘kräftig, 
mächtig’), -in (glesin ‘gläsern’, mannin ‘menschlich’), -isc (frenkisc ‘frankisch’), -ing 
(samahafting ‘Erhalter’), -ling (gataling ‘Verwandter’), -ohti (steinohti ‘steiniges 
Land’), -ð (schwache Verben II: salböta ‘salben (1./3. Sg. Prät.)’, salbönti ‘salben 
(Part. Präs.)’), -dro (liuböro ‘lieb (Komparativ)’), -dsto (höhösto ‘hoch (Superlativ)’), 
-öd (wizzöd ‘Gesetz’), -dti (einöti ‘Eindde, Wüste’), -unga (manunga ‘Ermahnung’). 
Die erste Silbe eines Suffixes mit „schwerem Mittelvokal“ ist immer mindestens 
zweimorig. Nach der hier vorgeschlagenen Analyse müssen alle Ableitungssilben, 
deren Vokal durch Nebenton geschützt ist, eigene prosodische Wörter bilden. 
Denn nur auf diese Weise kann über ihnen ein eigener metrischer Fuß errichtet 
werden. Alle diese Ableitungssilben sind dann ursprünglich Klasse-II-Affixe. Doch 
scheinen die vokalisch anlautenden Suffixe während der althochdeutschen Periode 
ihren Status als Klasse-II-Affixe aufgegeben zu haben. Konsonantisch anlautende 
Suffixe, wie z.B. -ling, -nissi, -lih, blieben dagegen Klasse-II-Affixe, vermutlich weil 
sie für sich einen metrischen Fuß bildeten — unabhängig vom Silbengewicht und 
Auslaut der vorausgehenden Silbe. Die morphologische Grenze fällt mit der 
prosodischen Wortgrenze zusammen, was stabilisierend gewirkt zu haben scheint. 
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Kopf (wegen HEAD(@)). Diese Füße müssen mindestens zweimorig sein 
(wegen FTBIN-u) und am linken Rand des sie unmittelbar dominierenden 
prosodischen Wortes stehen (wegen ALIGN-L(g, ®)). Die prosodisch 
vollständig strukturierte Outputform lautet dann [[(gäst),]. [nis).-silolo 
mit zwei Füßen und daher auch mit zwei Betonungen. Im Vergleich zu 
einem Wort mit Klasse-I-Affix wie /widar + oon/ — [(wi.da),.roon] , wird 
eine zusätzliche Betonung durch das Klasse-II-Affix erzwungen. 

Ableitungen mit Klasse-II-Affixen haben damit die gleiche prosodische 
Struktur wie Komposita. Erkennbar wird diese Parallelität vor allem in 
der Lautgeschichte: Kurzsilbige i- und u-Stämme behalten ihren 
Themavokal nicht nur im Nominativ und Akkusativ Singular, vgl. (61), 
sondern auch dann, wenn sie die Basis einer Klasse-II-Suffigierung bilden 
oder wenn sie als Erstglied in einem Kompositum stehen, vgl. (65a). Die 
Ursache dieser parallelen Entwicklung in morphologisch unterschiedlich 
konstruierten Wörtern ist nun klar: Die verschiedenen Wortformen haben 
die gleiche prosodische Struktur. Die prosodische Isomorphie von freien 
Lexemen, Kompositionen und Klasse-II-Affixen illustriert die 
Gegenüberstellung unter (67). 
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(67) Gleiche prosodische Struktur von Stammformen, Komposita und 


Klasse-II-Suffigierungen 


(67a) Kurzsilbige Stämme mit Themavokal 
Nom./Akk. Sg.: 


(67b) 


Kompositum: 


Klasse-II-A ffix: 


Langsilbige Stämme ohne Themavokal 
Nom./Akk. Sg.: 


Kompositum: 


Klasse-II-A ffix: 


[wini], 

[fridu],, 

[hugu],, 

[[wini]o [liod]o]o 
[[frido],, [man] „lo 
[[hugu] [lust] o]o 
[[wini] „[scaft] alo 
[[fridu] .[sam]] 
[huge] [ih] alo 
[[trugi] [lib] ole 


[gast]. 

[wald], 

[scilt],, 

[[gast] .[htis] o] o 
[[wald] [holz] olo 
[[scilt] „Lriemo] „lo 
[[gast] „Llih] alo 
[[wald] .[haft] o] o 
[{scilt] „Läri] olo 


‘Freund, Geliebter’ 
‘Friede’ 

‘Friede, Schutz’ 
‘Liebeslied’ 
‘Friedensbringer’ 
‘Gesinnung’ 

‘Liebe, Freundschaft’ 
‘friedfertig’ 
‘erfreulich’ 
‘triigerisch’ 


‘Gast’ (< *gasti) 
‘Wald’ (< *waldu) 
‘Schild’ (< *skildu) 
‘Gasthaus’ 
‘Waldbaum’ 
‘Schildriemen’ 
‘gastlich’ 

‘waldig’ 
‘Schildmacher’ 


Nun könnte gegen diese Analyse eingewandt werden, dass alleine der 
Ausfall des Themavokals im Nominativ und Akkusativ eines Substantivs 
ausreiche, damit der Themavokal auch überall dort ausfiele, wo derselbe 
Stamm in Kompositionen oder Suffigierungen verwendet werde. Jedoch 
liegt der Fall nicht so einfach, wie die Beispiele unter (68) beweisen. Der 
auslautende Vokal kann sowohl im freien Lexem schwinden und dennoch 
in Kompositionen und Ableitungen erhalten bleiben, vgl. (68a), als auch 
umgekehrt im freien Lexem beibehalten werden und dennoch in 
Kompositionen und Ableitungen schwinden, vgl. (68b). 
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(68) Auslautender Vokal in verschiedenen morphologischen Strukturen 


(68a) Schwund des auslautenden Vokals im freien Lexem, 

Beibehaltung in Kompositionen und in Ableitungen 
freies Lexem: [tag], ‘Tag’ (<*taga-) 

[spillo ‘Spiel, Scherz’ (< *spila-) 
Kompositum: [[taga],[lon],], “Tagelohn’ 

[[spila] [man] q] ‘Spielmann, Spaßmacher’ 
Klasse-II-Affix: [[taga][lihlal, täglich’ 

[[spila]„[lih],]o ‘spielerisch’ 


(68b) Beibehaltung des auslautenden Vokals im freien Lexem, 
Schwund des Vokals in Kompositionen und in Ableitungen 
freies Lexem: [erda], ‘Erde’ 

[milti], ‘sanftmiitig, gnädig’ 
Kompositum: [[erd],[biba]q]. ‘Erdbeben’ 

[[milt]o[herzi]olo ‘barmherzig’ 
Klasse-II-Affix: [[erd],[lih],], ‘irdisch’ 

[[milt],,[nissa],],, ‘Sanftmut, Gnade’ 


Aus den Beispielen in (68) erhellt, dass der Schwund auslautender Vokale 
nicht alleine von der morphologischen Struktur abhängen kann, sondern 
ganz wesentlich von der prosodischen Struktur bestimmt wird. 

Nach diesen Erläuterungen zur Prosodie des Althochdeutschen wird 
im Folgenden die Interaktion des i-Umlauts mit der prosodischen Wort- 
und Fußstruktur besprochen. 


6. Beschränkungsrangfolge beim i-Umlaut 


Der i-Umlaut im Althochdeutschen ist zu einem wesentlichen Teil (aber 
nicht nur) eine Palatalisierung. Die Vokale [a], [o], [u] sind als 
[+hinten] spezifiziert, die Allophone [a], [e], [i], [ø], [y] dagegen als 
[-hinten].° Die die Palatalharmonie beschreibende OT-Beschränkung 


6% Man beachte: Der hintere tiefe Vokal ist im Folgenden immer mit [a], der 
vordere tiefe Vokal mit [a] transkibiert. 
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fordert, dass Vokale innerhalb eines Wortes denselben Wert fiir das 
Merkmal [hinten] haben. 


(69) AGREE-[hinten] 


‘Benachbarte Segmente innerhalb eines Wortes müssen hinsichtlich 
ihres Wertes für das Merkmal [hinten] übereinstimmen.’ 


Dass die Vokale eines Wortes nicht nach Belieben palatalisiert, gerundet, 
gesenkt und gehoben werden dürfen, drücken die gegenläufigen Treue- 
beschränkungen der Familie IDENT-[F] aus. Sie fordern, dass die 
Spezifikationen für die Merkmale [hinten], [rund], [hoch] und [tief] 
nicht verändert werden. 


(70) IpenT-Beschrankungen für vokalische Merkmale 


(70a) IDENT-[hinten] 
‘Korrespondierende Input- und Outputsegmente stimmen 
hinsichtlich ihres Wertes für das Merkmal [hinten] überein.’ 


(70b) IDENT-[rund] 
‘Korrespondierende Input- und Outputsegmente stimmen 
hinsichtlich ihres Wertes für das Merkmal [rund] überein.’ 


(70c) IDENT-[hoch] 
‘Korrespondierende Input- und Outputsegmente stimmen 
hinsichtlich ihres Wertes für das Merkmal [hoch] überein. 


’ 


(70d) IDENT-[tief] 
‘Korrespondierende Input- und Outputsegmente stimmen 
hinsichtlich ihres Wertes für das Merkmal [tief] überein.’ 


Indem die Beschränkung IDENT-[hinten] von AGREE-[hinten] dominiert 
wird, kann sie unter bestimmten Bedingungen verletzt werden. Wenn 
nämlich ein hinterer Vokal im selben Wort steht, ist es erlaubt, hintere 
Vokale zu vorderen Vokalen zu wandeln, um AGREE-[hinten] zu erfüllen. 
Die Tableaus unter (71) illustrieren dies anhand der Beispielwörter ahd. 
ubil ‘Übel’ und sköni ‘Schönheit. 
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(71) AGREE-[hinten] >> IDENT-[hinten] 


(71a) /ubil/ — [ybil] 


/ubil/ AGREE-[hinten] IDEnT-[hinten] 
a. [ubil], x 
b. = [ybil]o * 


(71b) /skoonii/ — [scøønii] 


/skoonii/ AGREE-[hinten] IDENT-[hinten] 
a. [scoonii] o i 
b.= — [scggnii], x 


Doch AGreeE-[hinten] könnte auch erfüllt werden, indem nicht der erste 
Vokal umgelautet wird, sondern indem das i der zweiten Silbe zu einem 
hinteren Vokal [w] gewandelt würde. Der Laut [w] ist jedoch im 
Gegensatz zu [y] kein möglicher Outputvokal des Althochdeutschen. Die 
Beschränkungen *[y], *[o], *[e] und *[a], die das Auftreten der Vokale 
[y], [ø], [e] bzw. [a] im Output verbieten, werden von der Beschränkung 
*[ur] dominiert, die ihrerseits das Auftreten des Vokals [w] im Output 
verbietet. Zusammen mit der Rangfolge in (71) ergibt sich daraus, dass 
aus dem /u/ ein vorderer Vokal [y] wird, statt dass /i/ zu einem hinteren 
Vokal [w] würde Die Tableaus unter (72) illustrieren das 
Zusammenspiel der Beschränkungen anhand von Beispielen mit den 
Vokalen [y] und [ø]. Die Rangfolge von *[w] relativ zu den 
Beschränkungen AGREE-[hinten] und Ipent-[hinten] hat keinen Einfluss 
auf die Auswahl des optimalen Kandidaten, solange AGREE-[hinten] die 
Beschränkungen *[y], *[@], *[e] und *[a] dominiert. Die geteilten 
Tableaus zeigen an, dass die Beschränkungspaare nicht relativ zueinander 
geordnet werden können. 
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(72) *[w] > *[y], *[ø], *[el, *Lal 
(72a) /ubil/ — [ybil] 


/ubil/ AGREE- IDENT- *[u] | *[y] 
[hinten] | [hinten] 
a. [ubil], * 
b. = [ybil]o * * 
c. [ubul]o = x 


(72b) /skoonii/ — [skeenii] 


/skoonii/ AGREE- IDENT- *[w] | *[o] 
[hinten] | [hinten] 
a. [skoonii] o a 
b.=  [skøønii]a x = 
c. [skoonurur] o j * 


Der Umlautprozess ist nicht strukturbewahrend. Ein phonologischer 
Prozess ist dann strukturbewahrend, wenn die Segmente, die der Prozess 
als Output liefert, auch Elemente des zugrundeliegenden 
Segmentinventars sind, d.h. wenn keine neuen Segmente durch den 
Prozess geschaffen werden. In der allophonischen Umlautphase ist dies 
nicht der Fall. Es gibt keinen Oberflächenkontrast zwischen den hinteren 
Vokalen [a], [o], [u] und den entsprechenden Umlautvokalen [a], [e], 
[ø] und [y]. Gleichzeitig fordert das OT-spezifische Konzept der 
‘Reichhaltigen Basis’ (richness of the base), dass in der Optimalitätstheorie 
alle überhaupt nur denkbaren Inputformen berücksichtigt werden 
müssen. Die Vielfalt möglicher Inputformen zwingt dazu, allophonische 
Variation durch Beschränkungsrangfolgen auszudrücken. Es muss erklärt 
werden, warum Umlautvokale nur in Umlautumgebungen erscheinen 
können. 

Die allophonische, nicht strukturbewahrende Natur des Umlauts 
hängt nun von den nachfolgenden Rangordnungen ab. Einerseits muss 
AGREE-[hinten] die Beschränkungen *[y], *[@], *[e] und *[a] dominieren, 
da AGREE-[hinten] diese Vokale erzwingen kann. Andererseits müssen die 
Beschränkungen *[y], *[@], *[e] und *[a] die Beschränkung IDENT- 
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[hinten] dominieren, da die Umlautvokale nur in Verbindung mit 
Palatalharmonie erscheinen, vgl. (73a). In allen anderen Umgebungen 
miissen Umlautvokale des Inputs auf die entsprechenden hinteren 
Vokalen [u], [0], [a] abgebildet werden, wie in (73b) gezeigt wird. Das 
Tableau zeigt nur den Fall von *[y], aber die Rangordnung gilt genauso, 
wenn *[y] durch *[9], *[e] oder *[a] substituiert wird. 


(73) AGREE-[hinten] > *[y], *[e], *[e], *[a] > IpeEnT-[hinten] 
(= Umlaut als nicht strukturbewahrende allophonische Variation) 


(73a) Palatalharmonie erzwingt Umlautvokale 


/ubil/ AGREE-[hinten] | *[y] | IpEnT-[hinten] 
a. [ubil], * 
b. & [ybill« * * 


(73b) Umlautvokale können nicht unabhängig von der 
Palatalharmonie erscheinen 


/byl/ AGREE-[hinten] | *[y] | Ipent-[hinten] 
a. [byl], = 
b. 7 [bul]o * 


Inputformen mit einem kurzen /a/ werden in der Regel nicht zu [a], 
sondern zu [e] umgelautet. Die bisher etablierte Rangfolge |AGREE- 
[hinten] > IpenT-[hinten]] liefert dieses Ergebnis noch nicht. Die 
Fragezeichen ‘?’ in Tableau (74) zeigen an, dass die Kandidaten a und b 
gleich gut hinsichtlich [AGREE-[hinten] >> IpENT-[hinten]] abschneiden. 


(74) AGREE-[hinten] >> IDENT-[hinten] 


/gast+i/ AGREE-[hinten] IDENT-[hinten] 
a.? [ges.tilo * 
b. [gas.ti]o x 
c.? [gas.ti]o * 


Für die Hebung von /a/ > /e/ ist die Beschränkung AGREE,;[tief] 
verantwortlich, die aussagt, dass die Laute innerhalb eines prosodischen 
Wortes hinsichtlich des Merkmalswertes [tief] übereinstimmen müssen. 
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(75) AGREE,r- [tief] 


‘Benachbarte Segmente innerhalb eines prosodischen Wortes 
müssen hinsichtlich ihres Wertes für das Merkmal [tief] 
übereinstimmen.’ 


AGREE,;[tief] dominiert die Treuebeschränkung IpDEnT-[tief], kann also 
eine Hebung oder Senkung von Vokalen erzwingen.’ In Tableau (76) 
werden nur noch die beiden gleich guten Kandidaten [ges.til, und 
[gas.til. aus (74) miteinander verglichen. Der Kandidat [gas.til, verletzt 
die Beschränkung AGREE,-[tief], weil [a] als [+ tief] spezifiziert ist, [i] 
aber als [-tiefl. Da [ges.til, der realisierte Output ist, muss die 
Rangfolge [AGREE,‚[tief] > IDENT-[tief] | gelten. 


(76) AGREE,-[tief] > IDENT-[tief] 


/gast+i/ AGREE, [tief] IDENT-[tief] 


* 


a. 7 [ges.ti]o 


b. [gas.ti]o 


AGREEo-[tief] fordert auch die Hebung tiefer Vokale vor u. Eine Form wie 
ahd. tagum ‘Tag (Dat. Pl.)’ verletzt daher AGREE» [tief]. Die Formen 
*togum oder *tegum sind jedoch nicht als Output für /tag+ um/ möglich, 
weil sie die Treuebeschränkungen IDENT-[rund] bzw. IDENT-[hinten] 
verletzen. Das heißt, AGREE,,-[tief] muss von beiden 
Treuebeschrankungen dominiert werden, wie Tableau (77) zeigt. 


70 Die speziellen Bedingungen für Hebungen und Senkungen von 
Mittelsilbenvokalen im Althochdeutschen sind nur schlecht erforscht. In der 
vorliegenden Arbeit werden sie nur insofern behandelt, als sie den Umlaut durch i 
betreffen. Die Beschränkung AGREE,„-[tief] sollte aber auch zur Beschreibung 
sonstiger Aspekte der Mittelsilbenassimilation verwendbar sein. Vokale in 
Stammsilben und in Flexionsendungen sind durch Treuebeschränkungen besonders 
vor Veränderungen geschützt und bestimmen daher wesentlich die Qualität der 
Vokale in der Mittelsilbe. 
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(77) IDENT-[rund], IDENT-[hinten] >> AGREE, -[tief] 


/tag +um/ IDENT- | IDENT- AGREEg- 
[rund] | [hinten] [tief] 
a. 7 [ta.gum]o | * 
b. [to.gum]o ss | 
c. [te.gum]o i i 


Nur durch das Zusammenwirken von AGRFE-[hinten] und AGREE,-[tief] 
wird aus einem /a/ im Input ein /e/ im Output. Diese Interaktion der 
Beschränkungen ist in Tableau (78) zusammengefasst. Zur besseren 
Übersicht zeigt das Ausrufungszeichen ‘V an, welche Verletzung einer 
Beschränkung fatal für einen Kandidaten ist. Die graue Schattierung 
bedeutet, dass das Abschneiden eines Kandidaten hinsichtlich 
nachrangiger Beschränkungen für die Auswahl nicht mehr relevant ist. 


(78) AGREE-[hinten] > IpENT-[hinten] > AGREE- [tief] > IDENT-[tief] 


R AGREE- IDENT- AGREE, IDENT- 
CROSTA ME | [hinten] | [hinten] | [tefl | [Hef] 
a. [gas.ti] mf i 
b. [gas.ti] 4 = *] 
c.® [ges.tilo i a 
d. [gos.tilo Al $ 


Wie in Teil IV ausgeführt, lösen die Laute i und j keinen Umlaut aus, 
wenn sie in einer Stärkeposition stehen. Unter (79) sind die einschlägigen 
Beispiele aus (29) wiederholt, bei denen das j im Silbenanfangsrand nicht 
den nachfolgenden velaren Vokal umlautet, vgl. (79a), und das i in 
betonter Silbe nicht das unbetonte a der Folgesilbe umlautet, vgl. (79b). 
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(79) Kein Umlaut durch i, j in Stärkeposition 


(79a) j in silbeninitialer Position 


ahd. ia ‘ja, nun’ > mhd. ja 
ahd. iagon ‘jagen, treiben’ > mhd. jagen 
ahd. iamar ‘Jammer, Betriibnis’ > mhd. jämer 
ahd. iar ‘Jahr’ > mhd. jar 
ahd. ioh/iuh ‘Joch’ > mhd. joch 
ahd. iugund ‘Jugend’ > mhd. jugent 
ahd. iung ‘jung, neu’ > mhd. junc 


(79b) iim Nukleus der betonten Silbe 
ahd. stimma ‘Stimme’ 
ahd. skimbal ‘Schimmel’ 
ahd. klingan ‘klingen’ 
ahd. fingar ‘Finger’ 


Nach der bisher vorgeschlagenen OT-Analyse ist nicht ausgeschlossen, 
dass alle velaren Vokale in (79) durch das vorangehende j bzw. i 
umgelautet werden, also *l[jel, *ljegein), *[jaimar], *LDja:r], 
*[joh]/*Ljyhl, *ljygynd], *[jyng], *[stimme], *[klingen], *[finger], um 
die Beschränkungen AGrEE-[hinten] bzw. AGREEw [tief] zu erfüllen. Doch 
weder im Mittelhochdeutschen noch im Althochdeutschen gibt es 
orthographische Hinweise auf eine solche Umlautung. 

Was die Sequenzen jd, jó, jú in (79a) betrifft, so ist davon auszugehen 
dass nicht die Folgevokale an das j, sondern umgekehrt das j an die 
Folgevokale assimiliert wurde. Im Anfangsrand einer betonten Silbe gilt 
ahd. j vor den Vokalen a, o und u als koronaler Halbvokal [j], der mit 
dem Zungenblatt am vorderen harten Gaumen gebildet wird 
(=[—anterior, —apikal]), während die Stellung des Zungenrückens eher 
hinten und tief ist. Vor den Vokalen e und i dagegen hat ahd. j die 
Geltung eines dorsalen Frikativs [j], der mit gehobenem, vorverlagertem 
Zungenrücken gesprochen wird (=[-hinten, —tief, +hoch]). Diese j- 
Allophonie wird dadurch bewiesen, dass j vor a o und u im 
Althochdeutschen meist als (i), vor e und i dagegen meist als (g) 
geschrieben wird (Braune & Reiffenstein 2004: 8116, Anm. 1). Vor e und 
i wurde ahd. j also weiter vorn artikuliert als vor a, o und u. Nur der 
hohe, vordere Frikativ [j] hätte den Umlaut der nachfolgenden velaren 
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Vokale ausgelöst. Da der Halbvokal [j] aber weder als [—hinten] noch 
als [-tief] spezifiziert ist, interagiert er schon aus rein technischen 
Gründen nicht mit den OT-Beschränkungen AGree-[hinten] und AGREE,- 
[tief]. Der tiefere Grund für das Unterbleiben des Umlauts ist darin zu 
suchen, dass das j an den Folgevokal assimiliert wird. In einer betonten 
Silbe sind die Vokale besser vor Assimilationen geschützt als das j im 
Silbenanfangsrand, was wiederum daran liegt, dass der akustische 
Unterschied zwischen [j] und [j] sehr viel geringer ist als zwischen [a, o, 
u] und [a, ø, y].”" 

Fiir den zweiten Fall, das Unterbleiben der Hebung von a zu e nach i 
in (79b), bieten sich mehrere Erklärungsansätze an. Zum einen könnten 
die Vokale der Flexionssilben als morphologische Marker besonders vor 
Assimilationen geschützt sein, was ohne weiteres durch eine OT- 
Beschränkung ausgedrückt werden könnte. Gegen einen solchen 
Erklärungsansatz spricht jedoch einerseits, dass der Umlaut zunächst nur 
rein allophonisch auftrat und die Flexionssilben durch den Umlaut nicht 
neutralisiert worden wären. Andererseits zeigt sich im Althochdeutschen 
gerade die Tendenz, Vokalunterschiede in den unbetonten Flexionssilben 
zu neutralisieren. Diese Entwicklung mündet schließlich in der 
mittelhochdeutschen Nebensilbenreduktion. Die bessere Erklärung 
berücksichtigt daher, dass im Althochdeutschen zunächst noch fünf 
Nebensilbenvokale (/a, e, i, 0, u/) anzutreffen sind, später nur noch drei 
(/a, i, u/ oder /a, e, 0/) und schließlich nur mehr einer (/a/). In 
betonten Silben findet sich dagegen eine größere Vokalvielfalt, nämlich 
/a, a, e, ë, i, Ø, y, 0, u/. Der phonetische Grund dürfte darin zu suchen 
sein, dass die Vokalqualität in betonten Silben deutlicher wahrzunehmen 
ist und daher auch von einer Generation zur nächsten eher tradiert wird. 
Es wäre also durchaus denkbar, dass in unbetonten Silben zunächst 
Umlaute auftraten, diese aber in den nicht-prominenten Nebensilben 
nicht deutlich genug wahrgenommen wurden und daher auch nicht von 
den Spracherlernern phonemisiert wurden. Zu erklären bleibt demnach 
lediglich, weshalb a in unbetonter Silbe nicht zu e gehoben wird, wenn 
ein iin der vorangehenden Silbe steht. Auch dies lässt sich durch den 


71 Für unbetonte Silben gilt nicht dasselbe: germ. *ja in unbetonter Silbe wird 
zu ahd. e. Vokale in unbetonter Silbe sind weniger gut vor Assimilationen 
geschützt, wie auch die folgenden Ausführungen zeigen. 
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Spracherwerb erklären. Die verschiedenen Vokalqualitäten in unbetonten 
Silben müssen im Althochdeutschen weniger deutlich ausgeprägt 
gewesen sein als in betonten Silben. Insbesondere die akustische 
Differenz zwischen dem gehobenen [e] und dem nicht gehobenen [a] 
war in unbetonter Silbe geringer als in betonter Silbe. Die allophonischen 
Varianten erleichterten auch nicht die Perzeption des vorangehenden, 
betonten Vokals, sondern waren eher eine Verundeutlichung des 
unbetonten Vokals. Im Ergebnis wurde die Hebung zu [e] in unbetonter 
Silbe von den Hörern als die Koartikulation des [a] kompensiert. Die 
Schreiber wählten das entsprechende Graphem (a). 


7. Besonderheiten des Umlauts von a 


Was den Umlaut des Vokals a angeht, so sind die folgenden, unter (80) 
aufgeführten Besonderheiten zu beachten. 


(80) Die Hebung a > e unterbleibt 
(80a) bei langem [a:],”? oder 
(80b) wenn [i] erst in dritter Silbe steht, oder 


(80c) vor bestimmten Konsonanten, besonders vor (h), (r) oder (1), 
oder 


(80d) vor bestimmten i-haltigen Suffixen. 


Die Beobachtungen (80a), (80b) und (80c) lassen sich auf eine einzige 
positionsbezogene Treuebeschränkung zurückführen. Zentral für das 
Unterbleiben der Hebung des /a/ zu [e] in diesen Fällen ist, dass die 
ersten beiden Moren eines Fußes vor Veränderungen besonders geschützt 
sind. Dieser Schutz vor Assimilationen erleichtert den Hörern die schnelle 
Erfassung des Inhalts der ersten beiden Moren eines Fußes, denn diese 
enthalten regelmäßig die für das lexikalische und morphologische 


72 Zumindest unterbleibt die Hebung des langen ā zu geschossenem @. In den 
Dialekten wird ā unterschiedlich weit gehoben und unterliegt später auch weiteren 
Veränderungen, die aber nichts mehr mit dem Umlaut zu tun haben (Paul 2007: 
§L38). 
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Verständnis wichtigen Informationen. Im Althochdeutschen darf das 
Merkmal [tief] in den Segmenten, die mit den ersten beiden Moren 
verbunden sind, höchstens einmal geändert werden. Eine einmalige 
Anpassung des Merkmalswertes [tief] von ‘+’ zu ‘—’ wird toleriert, eine 
weitere Wertänderung bei einem zweiten Segment jedoch nicht. Dies 
illustriert die Abbildung unter (81), in der die verschiedenen möglichen 
Umlautumgebungen für /a/ dargestellt sind. Dabei steht ‘C’ für beliebige 
Konsonanten außer /h, r, 1/, [e] ist ein [—tief]-Vokal, [a] und [a] sind 
[+tief]-Vokale. Die Ränder des Fußes und des prosodischen Wortes sind 
durch runde bzw. eckige Klammern markiert. Der Pfeil weist darauf hin, 
dass dem Merkmal [+tief] im Input das Merkmal [-tief] im Output 
entspricht. Eine solche untreue Abbildung ist möglich, vgl. (81a) bis 
(81c). Sie darf jedoch nicht zweimal innerhalb des Fußes auftreten, was 
in den Beispielen (81d) und (81e) durch einen zweifachen Blitz markiert 
wird. 


(81) Abbildungstreue der Segmente im althochdeutschen Fuß 
hinsichtlich des Merkmals [tief] 


(81a) Kurze, offene Stammsilbe: 
/CaCi/ — [(Ce.Ci)] 
-G <a C i / 


[ "(EN er so 


(81b) Geschlossene Stammsilbe mit Kurzvokal: 
/CaCCi/ — [(CeC).Ci] 


/ C | C C i / 
[ C se SCH. 3. C i ] 
(81c) Diphthong in der Stammsilbe: 
/CaiC/ — [(CeiC)] 
/ C | ic / 
[ C e i Q ] 


(81d) Langvokal /a:/: 
/CaaCi/ — *[(Cee).Ci] 


A 
*[ (C e œ) Coi] 


(8le) /i/ in dritter Silbe: 
/CaCaCi/ — *[(Ce.Ce).Ci] 77 


/ C a C a C i / 
‚(Ce . Ge. GCG i ] 


Die Erscheinung, dass prominente Positionen eines Wortes eine höhere 
Resistenz gegenüber Assimilationen aufweisen, ist in zahlreichen OT- 
Analysen herausgestellt und durch positionsbezogene 
Treuebeschränkungen abgebildet worden (Alderete 1995; Beckman 1998, 
2002; Lombardi 1999). In diesen Arbeiten wurden unter anderem die 
Beschränkung IDENT-o,-[tief] vorgeschlagen, die die Änderung des 
Merkmalswertes [tief] in der ersten Silbe eines Wortes verbietet. 
Gleichzeitig wird angenommen, dass auch Langvokale im Gegensatz zu 
Kurzvokalen eine prominente Stellung einnehmen. Fine Vereinfachung 
wäre es, die ersten beiden Moren eines Fußes als prominente Positionen 
aufzufassen, die durch eine positionsbezogene Treuebeschränkung vor 
untreuen Abbildungen des Inputs geschützt sind. Da die ersten beiden 
Moren bei gewichtssensitiven Sprachen von besonders hoher Bedeutung 
sind, fügt sich eine solche Beschränkung problemlos in das Schema 
positionsbezogener Treuebeschränkungen ein. Um die mit Asterisk 


73 Die Formen, in denen nach Braune & Reiffenstein (2004: §27, Anm. 4) der 
Umlaut durch ein i in dritter Silbe eingetreten ist, haben die Form /CaCaCi(C)/, 
d.h. es handelt sich (1.) um Auflösungsstrukturen mit zwei kurzen, offenen Silben 
als Fuß und (2.) sind die ersten beiden Stammvokale kurzes a: ahd. nagal+i, 


zahar+i, magad+i magad+in, fraval+i, gi+wahan+en, gi+kamar+i 
gi+saman+i, nagal+en, garaw+en, framad+i etc. Einzige Ausnahme ist ahd. 
apful+i mit u als Mittelsilbenvokal. 
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versehenen Formen in (81d) und (81e) im Output zu verbieten, könnte 
man eine komplexe Beschränkung in der Art von (82) formulieren. 


(82) Komplexe Beschränkung für positionsgebundene 
Treuebeschränkung 


‘Mindestens eines der Outputsegmente, die den ersten beiden Moren 
eines Fußes zugeordnet sind, stimmt mit den korrespondierenden 
Inputsegmenten hinsichtlich seines Wertes für das Merkmal [tief] 
überein.’ 


Die Beschränkung würde bei einem entsprechend hohen Rang innerhalb 
der Beschränkungshierarchie verhindern, dass der Wert des Merkmals 
[hinten] gleichzeitig bei der ersten und bei der zweiten Mora verändert 
wird. Dadurch würde jedoch die formale Übereinstimmung mit den 
übrigen positionsbezogenen Treuebeschränkungen verloren gehen, die 
gegen jegliche Veränderung der ersten Silbe, des Kopfes oder eines 
Langvokals opponieren. Eine etablierte Möglichkeit, komplexe 
Beschränkungen in zwei einfache Beschränkungen zu zerlegen, ist die 
lokale Konjunktion von Beschränkungen. 


(83) Lokale Konjunktion (Smolensky 1993) 


Die lokale Konjunktion von C1 und C2 in Domäne D, [C1 & C2],, 
wird verletzt, wenn in einer Domäne D sowohl C1 als auch C2 
verletzt werden. 


Eine lokale Konjunktion wird dann verletzt, wenn beide konjungierten 
Beschränkungen zugleich in der Domäne D verletzt werden.’”* Dabei 
können zwei Markiertheits- oder zwei Treuebeschränkungen miteinander 
verknüpft werden, oder auch eine Markiertheitsbeschränkung mit einer 
Treuebeschränkung. Lokale Konjunktionen wurden bereits zur Analyse 
unterschiedlichster Phänomene angewandt, wie zum Beispiel 
Dissimilationen (Ito & Mester 1998), Vokalharmonie (Baković 2000), 
Chain Shifts (Kirchner 1996), Strict Cycle Effects (Lubowicz 2002) etc. 
Beschränkungen dürfen dabei auch mit sich selbst lokal konjungiert 


74 Da lokale Konjunktionen immer hinsichtlich einer bestimmten Domäne D 
definiert werden müssen, kann die Formulierung einer positionsbezogenen 
Treuebeschränkung im Sinne von Alderete, Beckman, Lombardi u.a. entfallen. 
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werden. Die komplexe Beschränkung in (82) kann als lokale 
Selbstkonjunktion der Treuebeschränkung IDENT-[tief] in der Domäne des 
prosodischen Fußes dargestellt werden. Die bereits in (70) eingeführte 
Beschränkung IDENT-[tief] wird unter (84) noch einmal wiederholt. 


(84) IDENT-[tief] 


‘Korrespondierende Input- und Outputsegmente stimmen 
hinsichtlich ihres Wertes für das Merkmal [tief] überein.’ 


(85) [IDEnT-[tief] & IDENT-[tief]], 


‘Innerhalb eines Fußes ọ darf IDEnT-[tief] nicht zweimal verletzt 
werden.’ 


Die lokale Selbstkonjunktion der Beschränkung IDENT-[tief] unter (85) 
mit dem Fuß als Domäne kann Langvokale der Stammsilbe sowie 
Kurzvokale in offener Stammsilbe vor einer doppelten Veränderung des 
Merkmalswertes [tief] schützen.” Dazu muss sie in der Hierarchie über 
AGREE,„-[tief] angesiedelt sein. Das Tableau (86a) demonstriert dies für 
Langvokale anhand von ahd. swari ‘schwer’, Tableau (86b) für i in dritter 
Silbe anhand von ahd. framadi ‘fremd’. Es werden nur Kandidaten 
verglichen, die AGREE-[hinten] bereits erfüllen, die also Palatalharmonie 
zeigen. 


(86) [IDENT-[tief] & IDENT-[tief]], > AGREE,-[tief] 


(86a) Langvokal /a:/: /swaari/ — [(swaa)..rilo 


; [IDENT-[tief] & ; 
AGREE, [Ít 
zswdaniy IpENT-[tief] ], or [tief] 


* 


a. 7 [(swaa) .ri] » 


b. [(swee).ri] 4 


75 Weitere Beispiele für den Schutz der ersten beiden Moren eines Fußes im 
Althochdeutschen liefern die Diphthongierung von germ. & zu ahd. ea > ia > ie 
und die Entwicklung von germ. eu zu eo > io > ie, die nur langsam über 
Zwischenschritte erfolgen, bei denen die Merkmalsspezifikationen entweder in 
Position V, oder V, erhalten bleiben. 
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(86b) /i/ in dritter Silbe: /framadi/ — [(fra.ma),.di], 


/framadi/ [IDENT-[tief] & AGREE, [tief] 
IDENT-[tief]], 
a. 7 [(fra.ma) 9.di] « = 
b. [Cfre.me)..di]o * 


Unterstellt wird in den beiden Tableaus (86a) und (86b), dass nur die 
Hebung beider /a/-Segmente zu [e] in Frage kame. Fiir den Langvokal in 
Tableau (86a) ist die Bildung eines Diphthongs [ae]/[ai] wohl aufgrund 
einer höherrangigen Beschränkung gegen allophonische 
Diphthongierungen ausgeschlossen. Doch für die Abbildung des Inputs in 
(86b) gibt es eine weitere Möglichkeit, die Beschränkung [IDENT-[tief] & 
IpENT-[tief]], zu erfüllen: Da die lokale Konjunktion nur verletzt wird, 
wenn ein Kandidat die Beschränkung IDENT-[tief] zweimal innerhalb des 
Fußes verletzt, kann auch lediglich der Mittelsilbenvokal gehoben 
werden, während der Vokal in der Stammsilbe tief bleibt. Nun zeigen die 
einschlägigen Formen fravili zahiri, nagilen etc, dass im 
Althochdeutschen die Assimilation zu e in unbetonten Mittelsilben- 
vokalen nicht erlaubt ist, sondern das Mittelsilben-a entweder ganz zu i 
gehoben werden muss, oder gar nicht gehoben wird.” Eine 
Beschränkung, die hier ad hoc als Assım-0,0, wiedergegeben wird, 
fordert, dass Mittelsilbenvokale an den nachfolgenden Vokal assimiliert 
werden. Tatsächlich steht Assım-0,0, als Abkürzung für einen Komplex 
weiterer Beschränkungen, die gemeinsam die beschriebenen Effekte 
erzeugen.” 


76 In späten Belege, wie z.B. magedi ‘Jungfrau (Gen. Sg. aus dem 11. 
Jahrhundert, zeigt das e lediglich die Reduktion unbetonter Vokale zu [ə] an. 

77 Die Beleglage zur Assimilation der Mittelsilbenvokale ist bei Braune & 
Reiffenstein (2004: 867) näher ausgeführt. Meist richtet sich der Mittelsilbenvokal 
nach dem Vokal der nachfolgenden Silbe. Dieses Phänomen soll durch Assım-0,0, 
abgekürzt wiedergegeben werden. 
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(87) Hebung des Mittelsilbenvokals zu i 


/framadi/ 


[IDENT-[tief] & 
IDeNT-[tief]]o 


AGREE > 


[tief] 


[(fra.ma) .di] 


[(fra.me) 9.di] 


[(fra.mi)o.di] » 


[(fre.ma)9.di] « 


[(fre.me) o.di] 


mo fale [s |p 


[(fre.mi)o.di] o 


Tatsächlich sind zwei Varianten der Formen mit i in zweiter und dritter 
Silbe für das Althochdeutsche belegt: einerseits fravili, zahiri, nagilen etc. 
ohne Hebung zu e, andererseits fremidi, hemidi, edili usw. mit Hebung zu 
e. Die Variante mit i in der Mittelsilbe und Umlaut des Stammvokals zu e 
muss dadurch entstanden sein, dass zunächst nur der Mittelsilbenvokal 
gehoben wurde (/framadi/ — [(fra.mi),.di],), und diese Outputform 
[(fra.mi),.di],, als neue Inputform übernommen wurde. Solch eine 
Übernahme in den Input geschieht, wenn Spracherlerner die bereits 
harmonisierte Form lexikalisieren. Den Ablauf zeigt die Abbildung in 


(88). 
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(88) Ausbreitung des Umlauts innerhalb eines Wortes durch 
Spracherwerb 


(88a) Altere Sprechergeneration geht von urspriinglicher 
Stammform aus, vgl. Tableau (87) 
Input: /framadi/ 
Output: [(fra.mi) .di] « 


(88b) Jiingere Sprechergeneration nutzt lexikalisierte Formen mit i 
in der Mittelsilbe als Input 


[IDENT-[tief] & | AGREE,- ASSIM- 


/framidi/ Inenr-[tiefl], | [tief] 0,03 


* 


a. [(fra.mi)>.di] 4 


b. = [(fre.mi)g.dil 4 


In Tableau (88b) verletzt der siegreiche Outputkandidat [(fre.mi),.di], 
die hochrangige lokale Konjunktion [IDENT-[tief] & IDENT-[tief]], nicht, 
da der Mittelsilbenvokal i bereits im Input als [—tief] spezifiziert ist. Nur 
noch in der ersten Silbe muss der [tief]-Merkmalswert des Vokals 
geändert werden. Da die einfache Verletzung von IDENT-[tief] erlaubt ist, 
siegt die Form [(fre.mi)y.di],, denn sie erfüllt die nachrangige 
Beschränkung AGREE,-[tief]. Bei fremidi handelt es sich um eine 
allophonische Variante von /framidi/, denn [e] ist auch nach der 
Umlautphonemisierung ein Allophon des Umlaut-/a/. Allophonische 
Varianz ist auch nach der Umlautphonemisierung zu erwarten. Anders 
verhält es sich bei niederfrequenten Wortformen wie dem Präteritum 
Optativ der rückumlautenden Verben, vgl. Teil II.8 Phonemisierung und 
morphologische Aspekte des Umlauts. Dort werden umgelautete Varianten 
nicht lexikalisiert: /brant+ii/ bleibt als /brant/ und /ii/ im Lexikon 
gespeichert. Nach der Lexikalisierung umgelauteter und nicht 
umgelauteter Varianten (= der erste Schritt der Phonemisierung) ist der 
Wechsel /a/ > [a] oder /a/ > [e] nicht mehr zu erwarten, weil dies 
keine allophonische Varianz wäre, sondern ein distinktiver Wechsel des 
Stammvokals. Die Beschränkungen AGREE,‚-[tiefl und AGREE-[hinten] 
bewirken im Althochdeutschen immer nur allophonische Varianz und 
verlieren mit der Phonemisierung der Umlautvokale an Einfluss. Ihre 
Aktivität wird durch die neu entstandenen Phonemgrenzen 
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eingeschrankt. Nach der Umlautphonemisierung kann der Umlaut sich 
nur noch morphologisch ausbreiten. 

Dagegen hatte die Form [(fre.mi),.di], in Tableau (87) nicht 
gewonnen, obwohl dieselbe Beschränkungshierarchie zugrundegelegt 
wurde. Der Unterschied zwischen (87) und (88) besteht lediglich in den 
Inputformen, nicht in der Beschränkungsrangfolge. Sprachwandel ist 
demnach nicht nur durch die Neuordnung von Beschränkungen möglich 
(Bermüdez-Otero 2005), sondern auch durch die Lexikalisierung 
bestehender Outputformen, die damit zu neuen Inputformen werden. 
Diese Beobachtung dürfte grundlegend für die Erklärung zahlreicher 
zielgerichteter Lautwandel sein, die sich über mehrere Sprecher- 
generationen hinweg allmählich in immer weitere Domänen oder in 
immer stärkerem Grade ausbreiten, wie z.B. die sich langsam 
verstärkende Nebensilbenreduktion im Althochdeutschen oder die 
stufenweise Diphthongierung von germ. ë zu ea > ia > ie. Außerdem 
wird damit auf einfache Weise erklärbar, weshalb sich Lautwandel 
oftmals Wort für Wort ausbreitet und meist nicht in einem großen 
Schwung alle Lexeme des Wortschatzes erfasst. Da die veränderten 
Outputformen erst einmal lexikalisiert, also zu neuen Inputformen, 
werden müssen, und da diese Lexikalisierung Wort für Wort geschieht, 
breitet sich auch Lautwandel nur Wort für Wort aus. Auch in 
althochdeutschen Denkmälern hat der i-Umlaut häufig erst einzelne 
Wörter erfasst, andere Wörter desselben Textes, die ebenfalls umgelautet 
sein sollten, zeigen keinen Umlaut. Die Gründe sind nicht nur in 
verschiedenen Schreiberhänden zu suchen, sondern auch in der 
Lexikalisierung der zugrundeliegenden Wortformen. Erst wenn der 
Umlaut lexikalisiert ist, wird er auch geschrieben. Und erst nach der 
Lexikalisierung kann eine ‘zweite Runde’ der Umlautung beginnen, wie in 
(88). 

Damit sind die ersten beiden Besonderheiten des Umlauts von /a/ aus 
Liste (80) erklärt. Die dritte Besonderheit (80c) betrifft die 
Hebungshemmung vor h, r und l. Dass h, r und l als tiefe Konsonanten in 
der Umlautumgebung wirken, hat Vennemann (1972b) bereits 
nachgewiesen. Die senkende Wirkung dieser Konsonanten zeigt sich 
unter anderem auch in den germanischen Monophthongierung ai > é vor 
h, r, w und au > ö vor Dentalen und h sowie im Unterbleiben der 
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altislandischen Brechung e > ja, wenn dem e die Konsonanten w, v, r, l 
vorangehen oder r oder l folgen. 

Was den i-Umlaut im Althochdeutschen betrifft, so unterbleibt die 
Hebung des kurzen a zu e am konsistentesten in Formen wie ahd. mahti 
‘Macht (Pl.)’, mahtig ‘mächtig’, nahti ‘Nacht (Gen./Dat. Sg.)’, gislahti 
‘Geschlecht, wahsit ‘wachsen (3. Sg. etc., in denen das h im 
Silbenendrand steht. Traditionell wird angenommen, dass dieses h in 
Kodaposition als stimmloser, gutturaler Frikativ aufzufassen sei. In 
unbetonten Silben gilt das (h) dagegen als Hauchlaut. Darauf deuten 
Schreibungen wie ahd. (dur) statt duruh ‘durch’ oder (weler) statt weliher 
‘welcher’ hin. Doch auch in der Silbenkoda einer betonten Silbe 
schwindet das h gelegentlich, wie die Beispiele unter (89) belegen. 


(89) Gelegentlicher Ausfall des (h) in der Silbenkoda betonter Silben 


(zö) für zöh ‘ziehen’ 
(hö) für höh ‘hoch’ 
(na) für nah ‘nahe’ 


Wie bereits von Iverson, Davis & Salmons (1994:136-139) erkannt 
wurde, ist im Althochdeutschen das h auch in der Koda einer betonten 
Silbe oftmals zum Hauchlaut geschwächt. Insbesondere fällt jedoch das h 
in den Verbindungen hs und ht regelmäßig aus, was dadurch zu erklären 
ist, dass h in dieser Verbindung schon lange nicht mehr dem stimmlosen 
Frikativ /x/ entspricht, sondern stimmloser Hauchlaut [h] ist. Diese 
Auffassung wird gestützt durch Wörter, in denen das ursprünglich 
vorhandene h bereits durchgängig fehlt, vgl. (90a), oder aber durch 
Schreibformen, in denen das h gelegentlich nicht geschrieben wird, vgl. 
(90b) und (91a), sowie auch durch auffällige Metathesen von h und tin 
der Schreibung, vgl. (91b). Der Frikativ muss auch in der Koda betonter 
Silben bereits ein reiner Hauchlaut gewesen sein, insbesondere in den 
Fällen, die unter (90) und (91) aufgelistet sind. 
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(90) Geltung des h vor s als Hauchlaut 


(90a) 


(90b) 


h fehlt durchgängig: 

ahd. mist ‘Mist’ (got. mathstus) 

ahd. lastar ‘Lasterung’ (< *lahstar) 
ahd. zéswa ‘rechte Seite’ (got. taíhswō) 
ahd. deismo ‘Hefe’ (< *deihsmo) 

ahd. niusen ‘versuchen’ (got. niuhsjan) 


h fehlt gelegentlich: 

ahd. (wast) für wahst ‘wachsen’ 

ahd. (wasmo) für wahsmo ‘wachsen’ 
ahd. (wasanti) für wahsanti ‘wachsen’ 
ahd. (wislen) für wihslen ‘wechseln’ 
ahd. (flas) für flahs ‘Flachs’ 


(91) Geltung des h vor t als Hauchlaut 


(91a) 


(91b) 


Die Fälle unter (91b) lassen sich leicht erklären, wenn für (h) ein 
Hauchlaut statt eines stimmlosen Frikativs angenommen wird. Das (h) 
markiert demnach die Aspiration des t. Der ursprüngliche vor dem t 
stehende Frikativ ist bereits so weit geschwächt, dass er in der Schrift 
nicht mehr markiert wird. Würde (h) in der Silbenkoda für den Frikativ 
/x/ stehen, entsprächen die Schreibungen in (91b) den phonologisch 


h fehlt gelegentlich: 

ahd. (reto) für rehto ‘recht’ 

ahd. (rötlich) für rehtlih ‘rechtlich’ 

ahd. (liotfaz) für liohtfaz ‘Licht, Lampe’ 
ahd. (leotkar) für liuhtkar ‘Lampe’ 

ahd. (intliuden) für intliuhten ‘erleuchten’ 
ahd. (trutin) für truhtin ‘Herrscher’ 


ht erscheint als (th): 

ahd. (nath) für naht ‘Nacht’ 
ahd. (lieth) für lieht ‘Licht’ 
ahd. (réth) für reht ‘recht’ 

ahd. (math) fiir maht ‘Macht’ 
ahd. (kneth) fiir kneht ‘Knecht’ 


missgebildeten Wörtern *[natx], *[lietx], *[retx] etc. 
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Aus phonologisch-phonetischer Sicht übernimmt der Konsonant /h/ 
die Ortmerkmalsspezifikationen des tautosyllabischen Vokals (vgl. z.B. 
Keating 1988). Distinktiv ist für /h/ nur die laryngale, behauchte 
Qualität. Um sich davon zu überzeugen vergleiche man die Artikulation 
des [h] in nhd. Hose [ho:ze], Hase [ha:ze], Hügel [hy:gal], Hegel [he:gal]). 
Als Hauchlaut stimmt er hinsichtlich seiner Spezifikation der 
Ortsmerkmale mit dem vorangehenden Vokal überein, kann also auch als 
behauchter Vokal aufgefasst werden, also Hose [go:ze], Hase [aa:ze], 
Hügel [yy:gall, Hegel [ee:gal]. Die Behauchung wird durch das Trema 
unter oder über dem Vokal angezeigt. 

In der Silbenkoda wirkt /h/ daher wie die Verlängerung des 
vorangehenden Vokals. Genauer gesagt: Im Input steht die Struktur /VV/. 
Das /h/ besteht nur in der Zusatzinformation, dass die Phonation nach 
dem Nukleusvokal aussetzt und der Vokal während der zweiten Mora in 
einen Hauchlaut übergeht. 


(92) Phonologische Repräsentation von (h) 


ahd. mahti ‘Macht (P1.)’ /maati/ — [maati] 
ahd. mahtig ‘mächtig’ /maatiig/ — [maatiig] 
ahd. nahti ‘Nacht (Gen./Dat. Sg.)’ /naati/ — [naati] 
ahd. gislahti ‘Geschlecht’ /gislaati/ — [gislaati] 
ahd. wahsit “wachsen (3. Sg.)’ /waasit/ — [waasit] 


ahd. giwahsti ‘Wuchs, Gewächs /giwaahsti/ — [giwaahsti] 
(Gen./Dat. Sg., Nom./Akk. Pl.)’ 


In der zugrundeliegenden Inputform stehen zwei Vokale /aa/, wobei der 
zweite Vokal zusätzlich mit der Information [+behaucht] versehen ist. 
Damit ist klar, dass die bereits besprochene lokale Beschränkungs- 
konjunktion [IDENT-[tief] & IDEnT-[tief]], für die Verhinderung der 
Hebung von /a/ in Wörtern wie ahd. mahti, mahtig, nahti, gislahti, wahsit 
etc. verantwortlich ist. Die Abbildung unter (93) illustriert die 
strukturelle Parallelität zwischen dem Langvokal /a:/ und dem Kurzvokal 
/a/ gefolgt von /h/. 
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(93) Umlautumgebungen fiir Langvokal /a:/ und Kurzvokal /a/+ /h/ 


(93a) Langvokal /a:/: 
/CaaCi/ — *[(Cee).Ci] 


u 4 u 

*[ (C e œ C i ] 
(93b) Kurzvokal /a/ vor (h): 
/CaaCi/ — *[(Cee).Ci] 

C 4 4 C i / 

‚I (C ee . C i |] 


Eine Hebung des Kurzvokals a zu e vor einem (h) bedeutet eine zweifache 
Verletzung der Beschränkung IDENT-[tief] innerhalb des Fußes. Ganz 
genauso, wie es beim Langvokal /a:/ der Fall ist. Dementsprechend 
verhindert auch hier die bereits erwiesene Beschränkungsrangfolge 
[IDENT-[tief] & IDENT-[tief]], > AGREE,-[tief] die Hebung zu [e]. 


(94) [IDENT-[tief] & IDENT-[tief]], > AGREE,-[tief] 


(94a) Kurzvokal /a/ vor (h): /maati/ — [(maa),.tilo 


I -[tief] & 
/maati/ [ENT Hi ef] AGREEo-[tief] 
IDENT-[tief] ], 


* 


a. 7 [(maa).-tilo 


b. [(meg)¢-tilo z 


Weiterhin können auch die Liquide r und l in der Silbenkoda die Hebung 
des a zu e verhindern. Sie tun dies jedoch nur gelegentlich in einigen 
oberdeutschen Dialekten. 
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(95) Hinderung der Hebung a zu e vor l und r in der Silbenkoda 
in einigen oberdeutschen Dialekten 


frk. heltis, heltit — obdt. haltis, haltit (zu ahd. haltan ‘halten’) 
frk. weltit — obdt. waltit ‘herrschen’ 

frk. eltiro — obdt. altiro (Komparativ zu ahd. alt ‘alt’) 

frk. belgi — obdt. balgi ‘Schlauch (P1.)’ 

frk. merren — obdt. merren, marren ‘Anstoß erregen’ 

frk. wermen — obdt. wermen, warmen ‘wärmen’ 


Der Grund für das gelegentliche Unterbleiben der Hebung im 
Oberdeutschen ist in der Artikulation der Liquide zu finden: /r/ und /1/ 
können nur mit relativ tiefem Zungenrücken gesprochen werden. Eine 
Hebung des Zungenrückens lässt Liquide mit sekundärer Artikulation 
entstehen: /1/ >/F, 1”/ und /r/ > /r"/.’® Sowohl [r"] als auch [F], [1*] 
sind in ihrem sekundären Artikulationsmerkmal als [ — tief] spezifiziert. 

Wenn die Liquide [r"], [Ñ], [I"] vor einem /i/ entstehen, so erfüllen 
sie einerseits die Markiertheitsbeschränkung AGREE,-[tief], andererseits 
verletzen sie durch die untreue Einführung der sekundären Artikulation 
auch die Treuebeschränkung Ipent-[tief]. Nun unterbleibt die Hebung 
eines vorangehenden a vor Liquiden in den betreffenden oberdeutschen 
Dialekten in aller Regel nur dann, wenn die Liquide in der Silbenkoda 
stehen. Denn das Hinzufügen der sekundären Artikulation unter 
gleichzeitiger Hebung des vorangehenden /a/ zu [e] würde zu einer 
Verletzung der lokalen Konjunktion [IDENT-[tief] & IDENT-[tief]], führen, 
wie die Tableaus unter (96) illustrieren. 7° 


78 Solche Liquide mit sekundärer Artikulation sind vermutlich die Vorstufe zur 
Vokalisierung, die in einer späteren Sprachperiode einsetzt. In den 
althochdeutschen Texten finden sich jedoch noch keine Hinweise auf j < loder w 
< r, vgl. aber Iverson, Davis & Salmons (1994:134-136) mit Beispielen für die 
Vokalisierung der Liquide in den modernen Dialekten. Für die dort postulierten 
vokalisierten Liquide im Althochdeutschen fehlen jedoch Belege. 

79 Einschränkend muss zu dieser Analyse gesagt werden, dass die Liquide /1/, 
/t/ normalerweise in der Phonologie nicht hinsichtlich des Merkmals [tief] 
spezifiziert werden. Damit die in den Tableaus (96a) und (96b) vorgeschlagene 
Lösung technisch funktioniert, müssen [r] und [l] aber mit dem Merkmal [+ tief] 
versehen sein. Nur so können sie AGREE„-[tief] verletzen, wenn sie neben einem 
nicht-tiefen Laut wie [i] oder [e] stehen. 
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(96) [IDENT-[tief] & IDENT-[tief]], > AGREE,-[tief] 


(96a) Hebungshinderung bei sekundärer Artikulation des /1/ 


[IDENT-[tief] & 


/haltit/ IpENT-[tiefl]. AGREE, [tief] 
a. 7 [(hab)etitlo = 
b. [heb) .tit]o $ 


(96b) Hebungshinderung bei sekundärer Artikulation des /r/ 


; [IDENT-[tief] & , 
t A -Lti 
/warmit/ Ipent-[tefll, GREE, [tief] 


* 


a. 7 [(war™)9.mit] 5 


b. [Cwer™) .mit] , $ 


Die Rangfolge [[IDENT-[tief] & IDENT-[tief]], > AGREE,-[tief]] gilt 
zunächst nur in jenen oberdeutschen Dialekten, in denen ein [e] vor 
Liquiden ausgeschlossen ist. In den übrigen Dialekten, in denen [e] vor 
[l] oder [r] durchaus stehen kann, könnten sich die Liquide so verhalten, 
wie es sonst nur transparente Vokale in vokalharmonischen Systemen 
tun, d.h. sie nehmen zwar nicht an der Harmonie teil, beginnen aber 
auch keine neue harmonische Spanne. Für einen Ansatz mit strikt lokaler 
Assimilation, in der Merkmale nicht einfach ein Segment überspringen 
können, stellen transparente Segmente innerhalb einer harmonischen 
Spanne ein bisher nicht überzeugend gelöstes Problem dar. Ein 
Lösungsvorschlag findet sich in Baković (2000), der allerdings einen 
völlig neuen Beschränkungstyp (targeted constraints) in die Analyse 
einführt. 

Was das Fränkische und die übrigen oberdeutschen Dialekte mit 
Hebung des a vor Liquiden betrifft, ist es wohl plausibler anzunehmen, 
dass die Liquide von den ersten umlautenden Sprechergenerationen 
zunächst zu [r"], [Ë] oder [1”] assimiliert wurden, zumindest aber eine 
sekundäre Artikulation aufwiesen, die mit dem Merkmal [-tief] 
beschrieben werden kann. Spätere Sprechergenerationen nahmen diese 
Outputformen, z.B. [(haF).tit] oder [(war”).mit], als Inputformen und 
hoben nun auch das /a/ im Nukleus, da sie damit 
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[IDENT-[tief] & IDENT-[tief]], nicht mehr verletzten. Es handelt sich also 
um dasselbe Erklärungsprinzip wie unter (88) bereits beschrieben. 


(97) Output der älteren Sprechergeneration als Input der jüngeren 
Sprechergeneration 


(97a) /hal'tit/ als Input 


; I -[ti & 
/haftit/ [IDENT [tief] AGREE- [tief] 
IDENT-[tief]], 


a. [hab titla * 


b.= _ [(heF),.tit], 


(97b) /war"mit/ als Input 


IDENT-[tief] & 
/warmit/ [ [ . fl AGREE, [tief] 
IDENT-[tief]], 


* 


a. [(war™)9.mit] o 


b. 7 [Cwer”),.mit]o 


Drei oberflächlich gänzlich unterschiedliche Hemmungsumgebungen für 
die Hebung des a zu e können also im Wesentlichen mit Hilfe einer 
einzigen Beschränkung erklärt werden: dem Verbot, innerhalb der ersten 
beiden Moren eines Fußes den Merkmalswert [tief] zweimal untreu im 
Output abzubilden. Bei langem [a:], bei [i] in dritter Silbe und bei den 
Konsonanten /h/, /r/, /V/ in der Silbenkoda verhindert die lokale 
Konjunktion [IDENT-[tief] & IDENT-[tief]], die Hebung zu /e/ in der ersten 
Mora. 

Nun bleibt lediglich die vierte Ausnahme von der Hebungsharmonie 
zu erklären, dass nämlich vor den Suffixen -nissi und -lih die Hebung zu e 
unterbleibt, wie in (98) illustriert.°® 


80 Für das in Paul (2007: L30, Anm. 3) genannte Suffix -lin, lässt sich nicht 
nachweisen, ob es a in der vorhergehenden Silbe hebt oder nicht, da (1.) im 
Althochdeutschen keine -lin-Suffigierungen mit a-haltigem Stamm, der umgelautet 
hätte werden können, belegt sind, und da (2.) im Mittelhochdeutschen -Im meist, 
wenn nicht sogar immer, in der dritten Silbe steht, so dass ohnehin keine Hebung 
des a zu erwarten ist: mhd. väterlin, mäntelin, bräkelin, stähelin, märmelin, ästelin 
(mit Sprossvokal sicherlich schon im Althochdeutschen) etc. 
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(98) Keine Hebung des a zu e vor den Suffixen -nissi und -lih 


ahd. infancnissa ‘Annahme’ 

ahd. irstantnissi ‘(Fest der) Auferstehung’ 
ahd. scantlih ‘schändlich’ 

ahd. langlih ‘lang’ 

ahd. kraftlih ‘stark, gewaltig’ 


Ein rein phonologischer Grund für das Unterbleiben der Hebung wird 
sich schwerlich finden lassen. Phonotaktisch parallel gebaute Suffixe, die 
ein i enthalten, mindestens zweimorig sind und Nebenton haben, 
bewirken meist den Umlaut des a zu e, z.B. die Suffixe ahd. -ig, -isc, -ing. 
Der Unterschied zwischen diesen Suffixen und den Suffixen -nissi und -lih 
muss im Lexikon festgelegt sein. Da diese Festlegung phonologische 
Konsequenzen hat, ist es nur plausibel anzunehmen, dass es sich um 
bestimmte Festlegungen für die Gestaltung der prosodischen Struktur der 
mit diesen Suffixen gebildeten Wörter handelt. Mit anderen Worten: Die 
Suffixe -nissi und -lih sind Affixe der Klasse II, bilden eigene prosodische 
Wörter und bewirken daher die Palatalisierung, aber nicht die Hebung 
eines vorangehenden a.®! Unter (66) wurde weiter oben bereits die 
Definition für die einschlägige Beschränkung ALicn-L(AffixIl, ©) gegeben. 
Sie wird unter (99) noch einmal wiederholt. 


81 Die Suffixe -nissi und -lih lauten konsonantisch an. Dies könnte den Weg für 
eine phonologische Analyse eröffnen. Hier wird jedoch umgekehrt angenommen, 
dass -nissi, -lih Klasse-II-Affixe blieben, weil sie konsonantisch anlauteten, während 
vokalisch anlautende Klasse-II-Suffixe im Althochdeutschen ihren Status als Klasse- 
II-Affixe verloren, vgl. Fußnote 68 auf Seite 156. Gestiitzt wird diese Annahme 
dadurch, dass vor den mit i anlautenden schweren Suffixen die Schreibungen für 
den Stammvokal /a/ zwischen (a) und (e) schwanken, vgl. ahd. mannin 
‘menschlich’ — glesin ‘glasern’, anahaftigo ‘mit etwas verbunden’ — kreftig ‘kräftig, 
mächtig’, tracisg ‘trakisch’ — frenkisc ‘frankisch’. In häufig gebrauchten Wörtern 
scheinen die vokalisch anlautenden Suffixe zudem ihren Status als Klasse-II-Affix 
früher verloren zu haben als in selteneren Bildungen. 


184 


(99) ALIcn-L(AffixII, œ) 


‘Der linke Rand jedes Klasse-II-Affixes ist auch der linke Rand eines 
prosodischen Wortes.’ 


Die unter (98) aufgeführten Wörter sind prosodisch daher wie folgt 
strukturiert, vgl. auch die Beispiele unter (67). 


(100) Prosodische Struktur von Bildungen mit den Suffixen -nissi und -lih 


[[infanc] „ [nissa] „| 
[[irstant] o [nissi] „] 
[[scant] „ [ih] o] 
[Lang], [ih] ol 
[[kraft],, [ih] a] 


Aus der bereits etablierten Rangfolge der Beschränkungen [AGREE,,[tief] 
> IpENT-[tief]] folgt, dass /a/ unter diesen Umständen nicht gehoben 
wird. Tableau (101) verdeutlicht dies am Beispiel von ahd. langlih. 


(101) AGREE,-[tief] > IDENT-[tief] 


/langliih/ AGREE,-[tief] IDENT-[tief] 
a. 7 [[lang]o[liih]o] 
b. [[leng][lith] „] * 


Da eine Hebung des /a/ zu [e] einerseits eine Verletzung von IDENT-[tief] 
bedeutet und andererseits keine Verbesserung hinsichtlich des 
höherrangigen AGREE,;[tief], ist Kandidat b weniger harmonisch als 
Kandidat a hinsichtlich der Beschränkungsrangfolge [AGREE,-[tief]l > 
IDeNT-[tief]]. Die Hebung zu [e] stellt keine Verbesserung, sondern eine 
Verschlechterung dar, weil lediglich eine Treuebeschränkung verletzt 
wird, ohne dass dies durch eine Markierungsbeschränkung erzwungen 
worden wäre. 
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Teil VI Zusammenfassung 


In der vorliegenden Arbeit wurde der althochdeutsche i-Umlaut als lokale 
Assimilation innerhalb eines Wortes bzw. eines prosodischen Wortes 
rekonstruiert. Dazu wurden zunächst die in den letzten Jahrzehnten 
erhobenen Einwände von Voyles (1991; 1992b), Iverson & Salmons 
(1996; 2003), Simmler (2000a), Salmons (2008) u.a. gegen die 
schreibungsstrukturalistische Erklärung des Umlauts (Twaddell 1938; 
Penzl 1949; Antonsen 1961, 1964) entkräftet und folgende Hypothesen 
verteidigt. 


(102) Hypothesen zum althochdeutschen i-Umlaut (Standardtheorie) 


(102a) i und j sind die ursprünglichen Auslöser des Umlauts im 
Althochdeutschen (phonetische Hypothese). 


(102b) Zu Beginn der althochdeutschen Sprachperiode treten 
bereits alle Umlaute als allophonische Varianten auf 
(phonemische Hypothese). 


(102c) Die allophonischen Umlautvarianten werden anfangs 
nicht in der Schrift wiedergegeben. Die Markierung des 
Umlauts setzt frühestens ein, als die Umlautalternanzen 
bedeutungsunterscheidende Funktion übernehmen 
(graphemische Hypothese). 


Die Phonemisierung des Umlauts wurde auf die Lexikalisierung 
umgelauteter Stämme und Wortformen zurückgeführt. Dadurch konnte 
das morphologisch motiviert erscheinende Unterbleiben des Umlauts im 
Präteritum Optativ der rückumlautenden Verben durch die niedrige 
Gebrauchsfrequenz dieser Flexionsformen erklärt werden, ohne dabei auf 
morphologische Beschränkungen zurückgreifen zu müssen. 

Intervokalische Koartikulation bildet die phonetische Basis für den 
Umlaut im Althochdeutschen. Die Umlautlautphonemisierung wurde auf 
phonetischer Ebene mit dem Aussetzen der Koartikulationskompensation 
seitens der Hörer gleichgesetzt und begründet. Dabei wurden vier Phasen 
der Umlautphonemisierung unterschieden. 
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(103) Phonemisierung der Umlautvokale in vier Phasen 


Phase 1: Sprecherseitige Koartikulation und hörerseitige 
Kompensation der Koartikulation kennzeichnen die 
allophonische Umlautphase 


Phase 2: Sprecherseitige Koartikulation ohne hörerseitige 
Kompensation führt zur kognitiven Entkoppelung der 
Umlautvarianten von den ursprünglichen 
Hinterzungenvokalen 


Phase 3: Weitere Wirkung der Koartikulation und damit 
Entwicklung neuer artikulatorischer Streubereiche 
sowie Stärkung der Opposition zwischen velaren und 
palatalen Vokalen 


Phase 4 Reduktion der Nebensilben sowie Morphologisierung 
des Umlauts (= Phonemisierung im klassischen 
Sinne, da Umlaute jetzt erst distinktiv und nicht 
mehr komplementär verteilt sind) 


Als definierendes Charakteristikum des Umlauts wurde ausgemacht, dass 
eine intervokalische Assimilation von einer Schwächeposition ausgeht 
und auch auf Vokale in einer prominenteren Position, wie z.B. die 
betonte Stammsilbe, wirken kann. Als definierende, phonologische 
Bedingungen für den althochdeutschen i-Umlaut wurden die 
Domänebedingung und die Schwächebedingung festgestellt. 
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(104) Phonologische Bedingungen fiir den i-Umlaut im 
Althochdeutschen 


Im Althochdeutschen tritt ein phonologisch bedingter Umlaut 
velarer Vokale (d.h. eine Palatalisierung) genau dann ein, wenn 


(104a) ein vokalisches oder konsonantisches i im selben 
prosodischen Wort mit einem urspriinglich velaren Vokal 
steht (Domänebedingung) und 


(104b) wenn dieser i-Laut weder als erster Laut im Anfangsrand 
noch im Nukleus einer betonten Silbe steht 
(Schwächebedingung). 


Davon unterschieden wurden die phonologischen Bedingungen für die 
Hebung von palatalen Kurzvokalen durch i. 


(105) Phonologische Bedingungen für die Hebung nicht-hoher, palataler 
Kurzvokale vor i 


Fiir nicht-hohe, palatale Kurzvokale, die im selben prosodischen 
Fuß mit einem i stehen, dazu zählt germ. ë und der nach Regel 
(104) eintretende Umlaut von a, gilt folgendes. 


(105a) In der Regel wird der Kurzvokal zu einem geschlossenen e 
gehoben (e-Default). 


(105b) Die Hebung zu e tritt nicht ein, (i) wenn die unmittelbar 
auf den Umlautvokal folgenden Konsonanten der Hebung 
zu kurzem, geschlossenem e entgegenstehen oder (ii) 
wenn der palatale Kurzvokal durch eine prosodische 
Wortgrenze vom i-Laut getrennt ist 
(Interferenzbedingung). 


Aus den so formulierten Bedingungen ergaben sich spezielle 
Charakteristika für den althochdeutschen i-Umlaut, insbesondere dass der 
i-Umlaut im Althochdeutschen sowohl regressiv als auch progressiv 
verläuft, was anhand des Lautwandels germ. *ja > ahd. e illustriert 
wurde. 

Neben dem i-Umlaut wurde für das Althochdeutsche auch ein u/o- 
Umlaut mit der Silbe als Wirkungsdomäne festgestellt, der sich in der 
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Monophthongierung von ahd. iu, in der Diphthongverengung germ. au > 
ahd. ou, in dem Lautwandel germ. aww > ou(w) und in der Auslaut- 
Monophthongierung ahd. ao > 6 manifestiert. 

Schließlich wurde der althochdeutsche i-Umlaut mit Hilfe der 
Markiertheitsbeschränkgungen AGREE-[hinten] und AGREE,-[tief] in der 
Optimalitätstheorie modelliert und die Ausnahmen beim Primärumlaut 
auf die lokale Selbstkonjunktion [IDENT-[tief] & IDENT-[tief]], oder auf 
prosodische Wortgrenzen zurückgeführt. 

Nebenbei wurde in einem Exkurs die Prosodie des Althochdeutschen 
im Rahmen der Optimalitätstheorie rekonstruiert, da prosodische 
Gegebenheiten die Ausbreitung des Umlauts wesentlich beeinflussen: Die 
Hebung von a zu e erfolgt nur innerhalb eines prosodischen Wortes. 

Die verwendeten OT-Beschränkungen sind unter (106) bis (109) 
aufgelistet. 


(106) Aktive Beschränkungen der prosodischen Struktur im 
Althochdeutschen, vgl. S. 143ff. 


ALIGN-L(6, @), ALIGN-L(@, œ), ALIGN-L(Rt, œ), ALIGN-L(AffixII, ©), 
HEAD(@), FTBIN-u, PARSE-G 


(107) Aktive AGREE-Beschränkungen im Althochdeutschen, vgl. S. 159ff. 
AGREE-[hinten], AGREE,-[tief] 
(108) Verwendete IDEnT-Beschränkungen, vgl. S. 159ff. 


IDENT-[hinten], IDENT-[rund], IDENT-[hoch], IDENT-[tief], 
[IDENT-[tief] & IDENT-[tief]], 


(109) Beschränkungen zur Abbildung präferierter und dispräferierter 
Vokale des Althochdeutschen, vgl. S. 161ff. 


*[ur], *Ly], *[o], “fel, *[a] 


Fiir das Althochdeutsche wurden die unter (110) und (111) aufgefiihrten 
Beschränkungsrangfolgen postuliert. Diese partiellen Ordnungen werden 
in Form von Baumdiagrammen zusammengefasst, wobei die 
Dominanzrelation durch einen Strich von der höheren zur tieferen 
Beschränkung dargestellt wird. 
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(110) Postulierte Beschränkungsrangfolgen der Prosodie 


FTBIN-u > PARSE-O FTBIN-u ALIGN-L(@, @) 
ALIGN-L(@, @) > PARSE-G res We 
PARSE-O 


(111) Postulierte Beschränkungsrangfolgen fiir Palatalisierung und 
Hebung 


*[u] > *[y], *[ø], *Lel, *[al 

AGREE-[hinten] > *[y], *[o], *[e], *[a] > Ipent-[hinten] 

AGREE, -[tief] >> IDENT-[tief] 

IDENT-[rund], IDENT-[hinten] > AGREE,,[tief] 

AGREE-[hinten] > IDENT-[hinten] > AGREE,-[tief] > IDENT-[tief] 
[IDENT-[tief] & IDENT-[tief]], > AGREE,-[tief] 


AGREE-[hinten] * [ur] 
*[y] *[ø] *[e] *[a] 


[IDENT-[tief] & IDENT-[hinten] IDENT-[rund] 


IDENT- a eee eae 


AGREE, -[tief] 


IDENT-[tief] 
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In der vorliegenden Arbeit werden Umlautprozesse als intervokalische 
Assimilationen innerhalb eines prosodischen Wortes rekonstruiert, die 
von Vokalen in unbetonter Stellung ausgehen. Diese Vokale in Schwä- 
cheposition können auch auf Vokale in einer prominenteren Stellung — 
wie etwa einer betonten Stammsilbe - wirken. Darin unterscheiden sich 
Umlautprozesse von vokalharmonischen Prozessen. 

Intervokalische Koartikulation bildet die phonetische Basis für den 
Umlaut. Eine entscheidende phonetische Voraussetzung für die Pho- 
nemisierung der i-Umlaute im Althochdeutschen ist das Aussetzen der 
Koartikulationskompensation seitens der Hörer. Nach dieser kognitiven 
Entkoppelung von Koartikulation und Koartikulationsauslöser werden 
die umgelauteten Vokale von nachfolgenden Sprechergenerationen zu- 
nächst lexikalisiert, um nach der Reduktion der Koartikulationsauslöser 
schließlich als neue Phoneme zu erscheinen. 

Eine maßgebliche Rolle bei der Lexikalisierung der Umlautallophone 
spielt die Gebrauchsfrequenz. Umlautallophone in Wortformen mit 
niedriger Gebrauchsfrequenz werden noch vor ihrer Lexikalisierung 
durch die umlautlosen Stammvokale ersetzt. So erklärt sich unter ande- 
rem das morphologisch motiviert erscheinende Unterbleiben des Um- 
lauts im Präteritum Optativ der rückumlautenden Verben, ohne dass 
dabei auf morphologische Beschränkungen zurückgegriffen werden 
müsste. 

Abschließend wird der althochdeutsche i-Umlaut im Rahmen der Op- 
timalitätstheorie rekonstruiert. Dazu werden Markiertheitsbeschrän- 
kungen der AGREE-Familie und die lokale Selbstkonjunktion einer 
IDENT-Beschränkung verwendet. Diese sind teilweise nur innerhalb 
eines prosodischen Wortes oder Fußes aktiv, woraus sich die bekannte 


Verteilung von Primär- und Sekundärumlaut ergibt. 
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